Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全国主要都市の交通事故と犯罪発生件数のデータ分析9 - R言語のglm関数でロジスティクス回帰分析をする。

 

www.crosshyou.info

 の続きです。

前回は線形回帰分析でkeihou(人口10万人当りの刑法犯認知件数)をkoutuu(人口千人当りの交通事故)とregion8(三大都市圏とその他)で回帰分析しました。

今回は、region7(三大都市圏とその他)をkeihouとkoutuuでロジスティクス回帰分析してみます。

f:id:cross_hyou:20201209203519p:plain

まず、region8という変数を作りました。三大都市圏なら1、その他なら0という2値をとる変数です。table関数で数えると、1が65個です。三大都市圏の都市が65個、その他の都市が40個あることがわかります。

ロジスティクス回帰分析はglm関数で実行できます。

f:id:cross_hyou:20201209210353p:plain

 

f:id:cross_hyou:20201209210539p:plain

family = "binomial" とするとロジスティクス回帰分析になります。

このglm_modrl1を使って予測をしてみます。

predict関数を使います。

f:id:cross_hyou:20201209210635p:plain

predict関数でtype = "response"とします。round関数で四捨五入して1か0の値にします。

table関数で予測値がどれだけ的中しているか見てみましょう。

f:id:cross_hyou:20201209210900p:plain

モデルの予測でその他と予想して、実際もその他だったのが30個、

モデルの予測で三大都市圏と予想して実際も三大都市圏だったのが55個、

つまり、85個的中しました。105都市中85都市が的中なので、的中率は

f:id:cross_hyou:20201209211104p:plain

81%です。

仮に全ての都市が三大都市圏だと予測したら、65都市が的中しますから、そのときの的中率は65/105=62%

f:id:cross_hyou:20201209211305p:plain

ですから、まあまあ良い的中率ではないでしょうか?
今回は以上です。