crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のエンゲル係数のデータの分析5 - R言語のlm関数で回帰分析をする。

 

www.crosshyou.info

 の続きです。

今回はR言語のlm関数で線形回帰分析をします。

engel: エンゲル係数を、gdp_pop: 1人当たりの県内総生産額【百万円】とmf: 男女比率、working: 15~64歳人口割合【%】という3つの変数を使って回帰分析します。

f:id:cross_hyou:20210313090603p:plain

summary関数で結果をみてみます。

f:id:cross_hyou:20210313090626p:plain

p-valueは0.000457と0.05よりも小さいので有意なモデルです。

gdp_popの係数は0.0002410とかなり小さくp値も0.90204なので有意な変数ではないです。

mfは-0.0956925が係数でp値が0.09232です。10%の水準で有意です。mf比率が高くなるとエンゲル係数が下がる、ということですね。

workingの係数が0.0033835でp値が0.00019なので1%以下でも有意です。workingの比率が1%上がると、エンゲル係数が0.0033835上昇する、ということです。

生活水準が上がるとエンゲル係数が下がると言えるのかな?この回帰分析モデルではそうとは言えないようですね。

残差プロットをみてみます。

f:id:cross_hyou:20210313091408p:plain

f:id:cross_hyou:20210313091434p:plain

残差の散らばりに目立った傾向はないようです。

この回帰分析から予測されるエンゲル係数と実際のエンゲル係数が乖離している都道府県はどこでしょうか?

f:id:cross_hyou:20210313092025p:plain

まず、実際のエンゲル係数と回帰分析モデルから予測されたエンゲル係数、それらの差のデータフレームを作ります。

f:id:cross_hyou:20210313092442p:plain

兵庫県、和歌山県、京都府、青森県、大阪府、新潟県が実際のエンゲル係数のほうが大きいのですね。近畿地方の府県が目立ちます。

その反対に実際のエンゲル係数が予測値よりも小さいところはどこでしょうか?

f:id:cross_hyou:20210313092846p:plain

茨城県、北海道、徳島県、富山県、鹿児島県。福岡県が実際のエンゲル係数のほうが小さいです。北は北海道から南は鹿児島県まで、地域的な傾向はない感じです。

今回は以上です。

はじめから読むには、

 

www.crosshyou.info

 です。