Photo by Tobias Stonjeck on Unsplash
の続きです。
今回は説明変数を複数にして、重回帰分析をしてみましょう。
まずは、log(Gdp) = log(Ed) + log(Pop) + log(Area) + u というモデルを分析してみます。
log(Pop)だけが有意な変数になりました。
Pop: 人口が多ければ、Gdp: 県内総生産は多くなるのは自然ですからね。
Gdp/Popを計算して、一人当り県内総生産額を被説明変数にしてみましょう。
log(Ed)の係数は 0.6312ですので、Edが1%増えると GdpPopは0.6312/100 = 0.006312増えます。Gdpは百万円単位で、Popは千人単位でしたから、GdpPopは千円/人ですね。
1000 * 0.006312 = 6.312円です。教育費が1%増えると、一人当り県内総生産額は6円30銭増えます。
Ed: 教育費と GdpPop: 1人当たり県内総生産額の関係性がいまいちピンとこないので、
教育費もPopで割って、1人当たり教育費にします。
log(GdpPop) = 1.59605 - 0.39936 * log(EdPop) - 0.02265 log(Area) + u
という回帰式が推計されました。
一人当り教育費が 1% 増えると、一人当り県内総生産額が -0.39936% 減るという、直感とは反対の結果ですね。一人当り教育費が多い = それだけ子どもが多い = 働く人が少ない = 県内総生産額が低い、という解釈でしょうか?
生徒数当りの教育費を考えたほうがきっといいですね。
R-squaredが0.1018ですので、一人当り県内総生産額を説明するには、可住地面積や一人当り教育費だけでは10%ぐらいしか説明できないということですね。
散布図を描いでみます。
今回は以上です。
次回は、
です。
初めから読むには、
です。