の続きです。
前回の分析で、小学校費は、人口の少ない県のほうが一人当たり小学校費が多く、県内総生産額の小さい県のほうが県内総生産額に占める割合が高いことがわかりました。
これをR言語の回帰分析関数のlm関数で分析してみます。
まず、2014年だけのデータフレームを作成しました。
summary関数で概要をみてみます。
per: 一人当たり小学校費をpop: 総人口とgdp: 県内総生産額で回帰分析してみます。
popの係数を見ると、-2.532e-06と符号がマイナスです。つまり人口が大きいほどper, 一人当たり小学校費は小さいということですね。
gdpの係数を見ると、2.216e-07と符号がプラスです。つまり県内総生産額が大きいほどper, 一人当たり小学校費は大きくなるということです。
plot関数で散布図をみてみます。
pop: 総人口と per: 一人当たり小学校費は係数の符号のとおり右肩下がりの分布ですが、gdp: 県内総生産額と per: 一人当たり小学校費は係数の符号はプラスだったのに散布図は右肩上がりですね。つまり、gdpとperだけを見ていては本質をとらえられないということですね。per = 4.608 - 2.532e-06 * pop + 2.216-e07 * gdp + u (uは誤差項)という回帰分析モデル式は、人口を一定の値としたとき、gdpが増えるほど、perが増えるということを表しています。考えてみれば、散布図のようにgdp: 県内総生産額が大きいほど per: 一人当たり小学校費減る、というのは不自然ですもんね。
次は、ratio: 小学校費が県内総生産額に占める割合とpop: 総人口と gdp: 県内総生産額の回帰分析モデルを見てみましょう。
pop: 総人口、gdp: 県内総生産額 両方とも係数のp値が0.05よりも大きく有意ではないです。
ratio: 小学校費の県内総生産額に対する割合は pop: 総人口とgdp: 県内総生産額では説明できないのですね。他の要因があるのでしょう。例えば、小学生の人数や小学校の数などかな。
今回は以上です。
次回は
です。
はじめから読むには、
です。