の続きです。
今回はR言語のlm関数で線形回帰分析をします。
engel: エンゲル係数を、gdp_pop: 1人当たりの県内総生産額【百万円】とmf: 男女比率、working: 15~64歳人口割合【%】という3つの変数を使って回帰分析します。
summary関数で結果をみてみます。
p-valueは0.000457と0.05よりも小さいので有意なモデルです。
gdp_popの係数は0.0002410とかなり小さくp値も0.90204なので有意な変数ではないです。
mfは-0.0956925が係数でp値が0.09232です。10%の水準で有意です。mf比率が高くなるとエンゲル係数が下がる、ということですね。
workingの係数が0.0033835でp値が0.00019なので1%以下でも有意です。workingの比率が1%上がると、エンゲル係数が0.0033835上昇する、ということです。
生活水準が上がるとエンゲル係数が下がると言えるのかな?この回帰分析モデルではそうとは言えないようですね。
残差プロットをみてみます。
残差の散らばりに目立った傾向はないようです。
この回帰分析から予測されるエンゲル係数と実際のエンゲル係数が乖離している都道府県はどこでしょうか?
まず、実際のエンゲル係数と回帰分析モデルから予測されたエンゲル係数、それらの差のデータフレームを作ります。
兵庫県、和歌山県、京都府、青森県、大阪府、新潟県が実際のエンゲル係数のほうが大きいのですね。近畿地方の府県が目立ちます。
その反対に実際のエンゲル係数が予測値よりも小さいところはどこでしょうか?
茨城県、北海道、徳島県、富山県、鹿児島県。福岡県が実際のエンゲル係数のほうが小さいです。北は北海道から南は鹿児島県まで、地域的な傾向はない感じです。
今回は以上です。
はじめから読むには、
です。