の続きです。
2006年度のデータフレーム、2011年度のデータフレームを作成します。
2011年度のデータフレームを使って、どの都道府県が睡眠時間が長いのかなどを見てみます。
神奈川県の男性が睡眠時間が一番短く453分です。秋田県が一番長く491分です。
時間に直せば、7.6時間、8.2時間です。
一回一回sort(tapply(~~~と入力するのは面倒なので、関数を作ります。
narabekaeという名前で関数を作りました。
この関数をlapply関数でいちどに変数に適用します。
女性の睡眠時間は広島県が一番短く、青森県が一番長いです。
男性の食事時間は鳥取県が一番短く、山梨県が一番長いです。
女性の食事時間は富山県が一番短く、山梨県が一番長いです。
男性の仕事時間は高知県が一番短く、栃木県が一番長いです。
女性の仕事時間は大阪府が一番短く、佐賀県が一番長いです。
変数間の相関関係をみてみます。
今回は、corrplot関数を使ってみようと思います。
はじめに、corrplotパッケージを読み込みます。
cor関数で相関マトリックスを作成します。
表示してみます。round関数で小数点以下2桁表示にします。
corrplot関数でグラフ表示します。
色が青いと相関係数が1に近く、赤いに近いと相関係数が-1に近くなります。パイチャートの大きさが相関係数の絶対値を表します。
あ、1人当りの県内総生産と人口密度の変数も作成しましょう。
これでもう一度、corrplot関数を作成してみます。今度は、typeを指定しないでやります。
今回は以上です。