Photo by Manson Yim on Unsplash
の続きです。
前回の分析で西日本のほうが、女性の人口(15~64歳)/男性の人口(15~64歳)の比率が高い傾向にあることがわかりました。
統計的に有意に違うのか検定してみます。
p-valueは1.125e-06とかなり小さいので、やはり統計的に有意な差ががあります。
そこで、こんどは、fm_popを被説明変数にして回帰分析をしてみます。
eastのp値が8.61e-05と1%以下の水準で有意です。incやlargeなど他の要因をコントロールしても東日本と西日本では、男女の人口比率に有意な差があります。
summary関数の結果を見ると、係数が~~~~e-05となっていてわかりにくいですね。
fm_popを100倍してパーセント表示にしてみましょう。
こちらのほうがわかりやすいですね。
東日本だと、incやkargeなど他の要因が同じならば、男女の比率(15~64歳)が-3.96、約4%低いということですね。
こんどは、fm: 女性の仕事の平均時間 / 男性の仕事の平均時間 を被説明変数にして回帰分析をしてみます。
これも係数が少しわかりにくいので、fmを比率でなくて、パーセント表示にして回帰分析をしてみます。
こちらのほうがわかりやすいですね。
p-valueは2.815e-05なのでモデルは有意なモデルです。
big6は1%以下の水準で有意ですし、noseaは5%以下の水準で有意です。
big6, 東京都、神奈川県、千葉県、埼玉県、愛知県、大阪府の都府県は、他の条件が同じならば、男女の仕事時間の比率は5.2%低い低い、ということです。
nosew, 海なし県は2.8%低いということですね。
今回は以上です。
次回は
です。
はじめから読むには
です。