crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の凶悪犯認知件数の分析3 - R言語で回帰分析。今回は対数値で回帰分析。可住地面積が広いほうが件数は少ない。

 

www.crosshyou.info

 の続きです。

今回は対数値のavgArea, avgGDPで回帰分析してみます。

f:id:cross_hyou:20191026141837j:plain

log(avgArea):log(avgGDP)の項目はいらないですね。削除します。

f:id:cross_hyou:20191026141944j:plain

model2を採用します。

f:id:cross_hyou:20191026142027j:plain

I(log(avgGDP)^2)はいらないですね。

f:id:cross_hyou:20191026142126j:plain

model3を採用します。

f:id:cross_hyou:20191026142218j:plain

I(log(avgArea)^2)はいらないですね。

f:id:cross_hyou:20191026142307j:plain

model4を採用します。

f:id:cross_hyou:20191026142355j:plain

Intercept, log(avgArea), log(avgGDP)の3つともPr(>|t|)が0.05より小さいので有意です。モデル全体のp-valueは2.124e-10なので有意なモデルです。

対数値をとるとavgArea, 可住地面積も凶悪犯認知件数に関連があることがわかります。

面積が広いほど、件数は減ります。GDPは大きいほど件数は増えます。これは前回と同じですね。

実際の凶悪犯認知件数とモデルの推測値を比べてみましょう。

f:id:cross_hyou:20191026143225j:plain

model4$fitted.valuesで上のようにモデルの推測値が出ます。

散布図を描いてみましょう。

f:id:cross_hyou:20191026143949j:plain

f:id:cross_hyou:20191026144001j:plain

横軸が実際の件数、縦軸が予測の件数、赤い直線が45度の線です。赤い直線の下にある都道府県が実際の件数が予測値よりも多い都道府県、赤い直線の上にあるのが実際の件数が予測値よりも少ない県です。

大阪府は実際の件数のほうが予測値よりも多く、東京都は実際の件数は予測値よりも少ないとわかります。

今回は以上です。