crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の仕事の平均時間のデータ分析2 - 男性は鹿児島県、香川県、新潟県などが長時間、女性は大分県、沖縄県、山形県などが長時間仕事をしている。

f:id:cross_hyou:20210905123558j:plain

Photo by Edrick Krozendijk on Unsplash 

www.crosshyou.info

の続きです。

男性の仕事の平均時間の長いところ、短いところはどこでしょうか?

f:id:cross_hyou:20210905124350p:plain

f:id:cross_hyou:20210905124423p:plain

鹿児島県、香川県、新潟県などが長い時間働いています。

山梨県、愛媛県、高知県が短いです。

同じ四国でも香川県は長時間、愛媛県、高知県は短時間なのですね。

女性のほうはどうでしょうか?

f:id:cross_hyou:20210905124911p:plain

f:id:cross_hyou:20210905124921p:plain

大分県、沖縄県、山形県などが長時間で、愛知県、大阪府、京都府が短時間です。

男性と女性の散布図を描いてみます。

f:id:cross_hyou:20210905125428p:plain

f:id:cross_hyou:20210905125439p:plain

男性の仕事の平均時間と女性の仕事の平均時間は正の相関関係があるように見えます。

cor.test()関数で確認します。

f:id:cross_hyou:20210905125657p:plain

相関係数は0.234でした。p-valueは0.1125ですから、10%水準では有意ではなく、15%水準では有意ですね。

男性と女性の仕事の平均時間の分散を比較してみます。

var.test関数を使います。

f:id:cross_hyou:20210905130133p:plain

p-valueは0.007と0.01よりも小さいので、1%の有意水準で分散は同じではないと言えます。

分散が同じではないので、平均値の比較ではなくて、分布位置の比較をします。

wilcox.test関数を使います。

f:id:cross_hyou:20210905130417p:plain

p-valueは2.2e-16よりも小さいので、分布が同じとはいえません。

目で見えるように可視化してみましょう。

f:id:cross_hyou:20210905131026p:plain

f:id:cross_hyou:20210905131055p:plain

グラフにしてみると、男性の仕事の平均時間と女性の仕事の平均時間はかぶっていないことがあきらかにわかりますね。

女性の仕事の平均時間 / 男性の仕事の平均時間 というレシオを計算してみましょう。

f:id:cross_hyou:20210905131554p:plain

f:id:cross_hyou:20210905131605p:plain

fmという名前の変数名で女性の仕事の平均時間 / 男性の仕事の平均時間 を定義しました。山形県が一番レシオが大きく、愛知県が一番レシオが低いです。

今回は以上です。

次回は

 

www.crosshyou.info

です。

はじめから読むには

 

www.crosshyou.info

です。