の続きです。
今回は対数値のavgArea, avgGDPで回帰分析してみます。
log(avgArea):log(avgGDP)の項目はいらないですね。削除します。
model2を採用します。
I(log(avgGDP)^2)はいらないですね。
model3を採用します。
I(log(avgArea)^2)はいらないですね。
model4を採用します。
Intercept, log(avgArea), log(avgGDP)の3つともPr(>|t|)が0.05より小さいので有意です。モデル全体のp-valueは2.124e-10なので有意なモデルです。
対数値をとるとavgArea, 可住地面積も凶悪犯認知件数に関連があることがわかります。
面積が広いほど、件数は減ります。GDPは大きいほど件数は増えます。これは前回と同じですね。
実際の凶悪犯認知件数とモデルの推測値を比べてみましょう。
model4$fitted.valuesで上のようにモデルの推測値が出ます。
散布図を描いてみましょう。
横軸が実際の件数、縦軸が予測の件数、赤い直線が45度の線です。赤い直線の下にある都道府県が実際の件数が予測値よりも多い都道府県、赤い直線の上にあるのが実際の件数が予測値よりも少ない県です。
大阪府は実際の件数のほうが予測値よりも多く、東京都は実際の件数は予測値よりも少ないとわかります。
今回は以上です。