Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の睡眠・食事・仕事の平均時間データの分析2 - R言語のcorrplot関数で相関係数プロットチャートを描く。

 

www.crosshyou.info

 の続きです。

2006年度のデータフレーム、2011年度のデータフレームを作成します。

f:id:cross_hyou:20200517111550j:plain

2011年度のデータフレームを使って、どの都道府県が睡眠時間が長いのかなどを見てみます。

f:id:cross_hyou:20200517111924j:plain

神奈川県の男性が睡眠時間が一番短く453分です。秋田県が一番長く491分です。

時間に直せば、7.6時間、8.2時間です。

一回一回sort(tapply(~~~と入力するのは面倒なので、関数を作ります。

f:id:cross_hyou:20200517112539j:plain

narabekaeという名前で関数を作りました。

この関数をlapply関数でいちどに変数に適用します。

f:id:cross_hyou:20200517112913j:plain

女性の睡眠時間は広島県が一番短く、青森県が一番長いです。

 

f:id:cross_hyou:20200517113022j:plain

男性の食事時間は鳥取県が一番短く、山梨県が一番長いです。

 

f:id:cross_hyou:20200517113136j:plain

女性の食事時間は富山県が一番短く、山梨県が一番長いです。

 

f:id:cross_hyou:20200517113242j:plain

男性の仕事時間は高知県が一番短く、栃木県が一番長いです。

 

f:id:cross_hyou:20200517113359j:plain

女性の仕事時間は大阪府が一番短く、佐賀県が一番長いです。

 

変数間の相関関係をみてみます。

今回は、corrplot関数を使ってみようと思います。

はじめに、corrplotパッケージを読み込みます。

f:id:cross_hyou:20200517113844j:plain

cor関数で相関マトリックスを作成します。

f:id:cross_hyou:20200517114418j:plain

表示してみます。round関数で小数点以下2桁表示にします。

f:id:cross_hyou:20200517114625j:plain

corrplot関数でグラフ表示します。

f:id:cross_hyou:20200517114829j:plain

f:id:cross_hyou:20200517114925j:plain

色が青いと相関係数が1に近く、赤いに近いと相関係数が-1に近くなります。パイチャートの大きさが相関係数の絶対値を表します。

あ、1人当りの県内総生産と人口密度の変数も作成しましょう。

f:id:cross_hyou:20200517115938j:plain

これでもう一度、corrplot関数を作成してみます。今度は、typeを指定しないでやります。

f:id:cross_hyou:20200517120805j:plain

f:id:cross_hyou:20200517120817j:plain

今回は以上です。