Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の睡眠・食事・仕事の平均時間のデータ分析4 - 仕事時間の減少幅は、もともとの仕事時間の長さと関係あり

 

www.crosshyou.info

の続きです。

前回の分析で仕事時間については、2006年度と2011年度で変化が有意にあるとわかりましたので、変化幅を計算してみます。

f:id:cross_hyou:20200518072853j:plain

names関数で都道府県の名前を付与しています。

sort関数で小さい順に並び替えます。

f:id:cross_hyou:20200518073003j:plain

青森県と佐賀県は40分減少していますが、長崎県は10分増加しています。

 

女性の仕事時間も同じようにやってみましょう。

f:id:cross_hyou:20200518073330j:plain

青森県は女性も一番減少しています。36分の減少です。京都府が一番増加しています。

男性と女性では相関はどうなっているでしょうか?plot関数で散布図を見てみます。

f:id:cross_hyou:20200518073912j:plain

f:id:cross_hyou:20200518073943j:plain

散布図を見ると相関は無さそうですね。cor.test関数を使って相関係数を検定します。

f:id:cross_hyou:20200518074235j:plain

p-value = 0.1541と0.05よりも大きいので、男性の仕事時間の変化幅と女性の仕事時間の変化幅には相関はありません。

男性の仕事時間の変化幅はどの変数と相関があるか調べてみます。まずは、2006年度のデータとの相関を見てみます。

f:id:cross_hyou:20200518080404j:plain

sapply関数をfunction(x) cor(x, Work_M_Chg)という自作関数に適用して各変数との相関を算出しています。2006年のWork_M(男性の仕事時間)と負の相関ですね。正の相関が一番強いのは男性の食事時間です。

2011年度のデータとの相関を見てみます。

f:id:cross_hyou:20200518080857j:plain

2011年度もWork_Mとの相関が一番強いです。

女性のほうも同じようにみてみます。

f:id:cross_hyou:20200518081146j:plain

今回は、sapply関数にさらにsort関数を重ねて相関係数を小さい順に表示しました。やはり女性の仕事時間が多かったところは減少しています。そして正の相関が一番強いのは男性のときと同じで、食事時間です。

2011年度も見てみます。

f:id:cross_hyou:20200518081803j:plain

2011年度とのデータでは、女性の睡眠時間が長いところほど負の相関が強いです。

仕事時間の減少幅は、もともとの仕事時間が長いほど、もともとの食事時間が長いほど大きくなるようです

cor.test関数で相関関係が有意かどうか調べます。

f:id:cross_hyou:20200518082833j:plain

p-valueは6.793e-06なので相関関係は有意です。

Eat_Mとの相関はどうでしょうか?

f:id:cross_hyou:20200518083051j:plain

p-valueは0.1171なので有意な相関とは言えないです。

 

女性の仕事時間も見てみます。

f:id:cross_hyou:20200518083613j:plain

p-valueは2.924e-07と0.05よりも小さいので、相関関係は有意です。

Eat_Fとの相関も見てみます。

f:id:cross_hyou:20200518084106j:plain

p-valueは0.126と0.05よりも大きいので、食事時間のは相関があるとは言えないです。

 

今回は以上です。