Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の仕事の平均時間のデータ分析4 - 海のない県のほうが、女性の仕事の平均時間/男性の仕事の平均時間 は低い。

f:id:cross_hyou:20210911082155j:plain

Photo by Manson Yim on Unsplash 

www.crosshyou.info

の続きです。

前回の分析で西日本のほうが、女性の人口(15~64歳)/男性の人口(15~64歳)の比率が高い傾向にあることがわかりました。

統計的に有意に違うのか検定してみます。

f:id:cross_hyou:20210911082925p:plain

p-valueは1.125e-06とかなり小さいので、やはり統計的に有意な差ががあります。

そこで、こんどは、fm_popを被説明変数にして回帰分析をしてみます。

f:id:cross_hyou:20210911083309p:plain

eastのp値が8.61e-05と1%以下の水準で有意です。incやlargeなど他の要因をコントロールしても東日本と西日本では、男女の人口比率に有意な差があります。

summary関数の結果を見ると、係数が~~~~e-05となっていてわかりにくいですね。

fm_popを100倍してパーセント表示にしてみましょう。

f:id:cross_hyou:20210911085858p:plain

こちらのほうがわかりやすいですね。

東日本だと、incやkargeなど他の要因が同じならば、男女の比率(15~64歳)が-3.96、約4%低いということですね。

こんどは、fm: 女性の仕事の平均時間 / 男性の仕事の平均時間 を被説明変数にして回帰分析をしてみます。

f:id:cross_hyou:20210911090517p:plain

これも係数が少しわかりにくいので、fmを比率でなくて、パーセント表示にして回帰分析をしてみます。

f:id:cross_hyou:20210911090851p:plain

こちらのほうがわかりやすいですね。

p-valueは2.815e-05なのでモデルは有意なモデルです。

big6は1%以下の水準で有意ですし、noseaは5%以下の水準で有意です。

big6, 東京都、神奈川県、千葉県、埼玉県、愛知県、大阪府の都府県は、他の条件が同じならば、男女の仕事時間の比率は5.2%低い低い、ということです。

nosew, 海なし県は2.8%低いということですね。

今回は以上です。

次回は

 

www.crosshyou.info

です。

はじめから読むには

 

www.crosshyou.info

です。