crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の凶悪犯認知件数の分析2 - R言語で人口10万人当りの凶悪犯認知件数を計算して回帰分析。経済活動が活発なほど件数は多い。

 

www.crosshyou.info

 の続きです。

今回は、人口10万人当りの凶悪犯認知件数を算出して、これを可住地面積と県内総生産額で回帰分析してみます。

f:id:cross_hyou:20191026104129j:plain

大阪府は人口10万人当りの件数でも一番多いですね。

一番少ないのは山形県です。

グラフにしてみます。

f:id:cross_hyou:20191026104351j:plain

f:id:cross_hyou:20191026104401j:plain

大阪府の件数の多さは突出していることがわかります。

それでは、回帰分析してみます。lm関数を使います。

f:id:cross_hyou:20191026104712j:plain

avgArea:avgGDPの項目は不要ですね。削除します。

f:id:cross_hyou:20191026105005j:plain

Pr(>F)が0.9377と0.05よりも大きいので、model1とmodel2では有意な違いはありません。より単純なmodel2を採用してさらに調べます。

f:id:cross_hyou:20191026105204j:plain

I(avgArea^2)は不要ですね。削除します。

f:id:cross_hyou:20191026105358j:plain

Pr(>F)が0.08373なのでmodel3を採用してさらに調べます。

f:id:cross_hyou:20191026105521j:plain

avgAreaのPr(>|t|)が0.0671と0.05より大きいので、avgAreaはいらないですね。削除します。

f:id:cross_hyou:20191026105746j:plain

model4を採用してさらに詳しく調べます。

f:id:cross_hyou:20191026105919j:plain

これで、切片(Intercept)、avgGDP, I(avgGDP^2)のすべてのPr(>|t|)が0.05以下になりました。p-valueは2.04e-10なので有意な統計モデルです。Adjusted R-squaredは0.6208なので、このモデルで人口10万人当りの凶悪犯認知件数の62%が説明できます。

散布図とモデルの回帰曲線を描いてみます。

f:id:cross_hyou:20191026110451j:plain

まず、上のように、回帰曲線のxvとyvを用意します。xvはavgGDPの最小値から最大値を100個に区切ったベクトルです。yvはpredict関数でxvに対応するyv、つまり凶悪犯認知件数を算出しています。

f:id:cross_hyou:20191026110831j:plain

f:id:cross_hyou:20191026110842j:plain

avgGDPの右端のプロットは東京都ですね。東京都が無ければ単純にavgGDPが大きいほど凶悪犯件数は多いようですね。経済活動が活発なほうが強盗する機会も多いでしょうからね。

今回は以上です。