の続きです。
前回、女性の仕事時間 / 男性の仕事時間 という変数をfmという名前で作りました。
女性の人口 (15~64歳)/ 男性の人口(15~64歳) の変数をfm_popという名前で作ります。
こうしてみると東日本は比較的女性が少なく、西日本は多いことがわかります。
そして、奈良県は特別に男性よりも多いことがわかります。
ここで、主要な変数間の相関係数を見てみます。
inc: 1人当たり県民所得(平成17年基準, 千円)
large: 従業員300人以上の事業所の従業者割合(民営)(%)
male_m: 仕事の平均時間(有業者・男)(分)
female_: 仕事の平均時間(有業者・女)(分)
fm: 女性の仕事時間/男性の仕事時間
fm_pop: 女性人口(15~64歳)/男性の人口(15~64歳)
です。
incと一番相関があるのは、largeですね。相関係数は0.827です。大きな事業所のほうが所得は高いでしょうね。
female_mとfmが0.885とかなりの高相関です。分母のmale_mが都道府県であまりかわらないからでしょうかね?
incを被説明変数(explained variable)に、large, male_m, fm, fm_pop, east, big6, noseaを説明変数(explanatory variables)にして回帰分析をしてみましょう。
p-valueは3.226e-09とかなり小さく、この回帰分析モデルは有意であることがわかります。
largeのp値が2.31e-07と有意ですね。あとは、fmが0.0984なので10%水準で有意です。
fmは女性の仕事時間/男性の仕事時間ですから、比率が0.1上がると、incは0.1 x -1994.136 = 199.4, つまり20万円ぐらい1人当たり県民所得が下がる、ということですね。
今回は以上です。
次回は
です。
はじめから読むには
です。