今回は、消費者態度指数の各データ同士の相関係数を調べてみたいと思います。
まずは、csvファイルに保存してあるデータを、read.csv関数で読込み、summary関数で表示します。
まずは、指数(3列目)、暮らし(5列目)、収入(7列目)、雇用(9列目)、耐久消費財(11列目)、資産(13列目)の原データ同士の相関をみてみましょう。
相関係数を算出する関数はcor関数ですが、この関数はデータフレームに一度に適用できます。なので、まず、taido2 <- taido[ , c(3,5,7,9,11,13)]と原データのみのデータフレームを用意します。
このデータフレームに対してcor関数を使います。
このように簡単に相関マトリックスが表示されます。ちょっと桁数が多くてごちゃごちゃしていますね。print関数とその引数のdigitsを使って、小数点以下2桁までの表示にしてみましょう。
一番相関の低い組み合わせは、雇用と耐久消費財の0.63ですね。概ね相関は高いようです。
同じように、前年差同士の相関マトリックスを作成しましょう。
まずは、前年差だけのデータフレームを作ります。
このデータフレームには、NAがあるので、NAのある行を削除したデータフレームにします。na.omit関数を使います。
これでcor関数を使う準備ができました。原データと同じように、print関数とdigits=2というオプションを使って小数点以下2桁までの相関マトリックスを表示します。
相関係数が一番低い組み合わせは、雇用前年差と耐久消費財前年差でした。原データの組み合わせと同じですね。
cor関数とprint関数で小数点以下2桁の相関マトリックスを作成します。このデータフレームには、NAがあるので、na.rm=TRUEというオプションをcor関数に適用します。