の続きです。
今回は、人口10万人当りの凶悪犯認知件数を算出して、これを可住地面積と県内総生産額で回帰分析してみます。
大阪府は人口10万人当りの件数でも一番多いですね。
一番少ないのは山形県です。
グラフにしてみます。
大阪府の件数の多さは突出していることがわかります。
それでは、回帰分析してみます。lm関数を使います。
avgArea:avgGDPの項目は不要ですね。削除します。
Pr(>F)が0.9377と0.05よりも大きいので、model1とmodel2では有意な違いはありません。より単純なmodel2を採用してさらに調べます。
I(avgArea^2)は不要ですね。削除します。
Pr(>F)が0.08373なのでmodel3を採用してさらに調べます。
avgAreaのPr(>|t|)が0.0671と0.05より大きいので、avgAreaはいらないですね。削除します。
model4を採用してさらに詳しく調べます。
これで、切片(Intercept)、avgGDP, I(avgGDP^2)のすべてのPr(>|t|)が0.05以下になりました。p-valueは2.04e-10なので有意な統計モデルです。Adjusted R-squaredは0.6208なので、このモデルで人口10万人当りの凶悪犯認知件数の62%が説明できます。
散布図とモデルの回帰曲線を描いてみます。
まず、上のように、回帰曲線のxvとyvを用意します。xvはavgGDPの最小値から最大値を100個に区切ったベクトルです。yvはpredict関数でxvに対応するyv、つまり凶悪犯認知件数を算出しています。
avgGDPの右端のプロットは東京都ですね。東京都が無ければ単純にavgGDPが大きいほど凶悪犯件数は多いようですね。経済活動が活発なほうが強盗する機会も多いでしょうからね。
今回は以上です。