Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の仕事の平均時間のデータ分析3 - 東日本は女性(15~64歳)が少なく、西日本は多い。

f:id:cross_hyou:20210910195123j:plain

Photo by Dileep M on Unsplash 

www.crosshyou.info

の続きです。

前回、女性の仕事時間 / 男性の仕事時間 という変数をfmという名前で作りました。

女性の人口 (15~64歳)/ 男性の人口(15~64歳) の変数をfm_popという名前で作ります。

f:id:cross_hyou:20210910200052p:plain

f:id:cross_hyou:20210910200103p:plain

こうしてみると東日本は比較的女性が少なく、西日本は多いことがわかります。

そして、奈良県は特別に男性よりも多いことがわかります。

ここで、主要な変数間の相関係数を見てみます。

f:id:cross_hyou:20210910200606p:plain

inc: 1人当たり県民所得(平成17年基準, 千円)

large: 従業員300人以上の事業所の従業者割合(民営)(%)

male_m: 仕事の平均時間(有業者・男)(分)

female_: 仕事の平均時間(有業者・女)(分)

fm: 女性の仕事時間/男性の仕事時間

fm_pop: 女性人口(15~64歳)/男性の人口(15~64歳)

です。

incと一番相関があるのは、largeですね。相関係数は0.827です。大きな事業所のほうが所得は高いでしょうね。

female_mとfmが0.885とかなりの高相関です。分母のmale_mが都道府県であまりかわらないからでしょうかね?

incを被説明変数(explained variable)に、large, male_m, fm, fm_pop, east, big6, noseaを説明変数(explanatory variables)にして回帰分析をしてみましょう。

f:id:cross_hyou:20210910201944p:plain

p-valueは3.226e-09とかなり小さく、この回帰分析モデルは有意であることがわかります。

largeのp値が2.31e-07と有意ですね。あとは、fmが0.0984なので10%水準で有意です。

fmは女性の仕事時間/男性の仕事時間ですから、比率が0.1上がると、incは0.1 x -1994.136 = 199.4, つまり20万円ぐらい1人当たり県民所得が下がる、ということですね。

今回は以上です。

次回は

 

www.crosshyou.info

です。

はじめから読むには

 

www.crosshyou.info

です。