crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

消費者態度指数の分析3 - R言語で各データの相関係数を調べる。

今回は、消費者態度指数の各データ同士の相関係数を調べてみたいと思います。

まずは、csvファイルに保存してあるデータを、read.csv関数で読込み、summary関数で表示します。

f:id:cross_hyou:20180702162202j:plain

まずは、指数(3列目)、暮らし(5列目)、収入(7列目)、雇用(9列目)、耐久消費財(11列目)、資産(13列目)の原データ同士の相関をみてみましょう。

相関係数を算出する関数はcor関数ですが、この関数はデータフレームに一度に適用できます。なので、まず、taido2 <- taido[ , c(3,5,7,9,11,13)]と原データのみのデータフレームを用意します。

f:id:cross_hyou:20180702162729j:plain

このデータフレームに対してcor関数を使います。

f:id:cross_hyou:20180702162907j:plain

このように簡単に相関マトリックスが表示されます。ちょっと桁数が多くてごちゃごちゃしていますね。print関数とその引数のdigitsを使って、小数点以下2桁までの表示にしてみましょう。

f:id:cross_hyou:20180702163546j:plain

一番相関の低い組み合わせは、雇用と耐久消費財の0.63ですね。概ね相関は高いようです。

同じように、前年差同士の相関マトリックスを作成しましょう。

まずは、前年差だけのデータフレームを作ります。

f:id:cross_hyou:20180702163913j:plain

このデータフレームには、NAがあるので、NAのある行を削除したデータフレームにします。na.omit関数を使います。

f:id:cross_hyou:20180702164643j:plain

これでcor関数を使う準備ができました。原データと同じように、print関数とdigits=2というオプションを使って小数点以下2桁までの相関マトリックスを表示します。

f:id:cross_hyou:20180702164919j:plain

相関係数が一番低い組み合わせは、雇用前年差と耐久消費財前年差でした。原データの組み合わせと同じですね。

 

cor関数とprint関数で小数点以下2桁の相関マトリックスを作成します。このデータフレームには、NAがあるので、na.rm=TRUEというオプションをcor関数に適用します。