都道府県別のデジタル教科書の整備率のデータの分析７ - R言語のglm関数でロジスティクス回帰分析をする。

の続きです。

今回はR言語のglm関数でロジスティクス回帰分析をします。よく考えたら、整備率のデータは0%か100%と、取り得る値の範囲が決まっていますから、lm関数で単純な線形回帰よりもglm関数でロジスティクス回帰分析をしてほうが当てはまりがいいような気がしました。

やってみます。

まず、dg_hを%表示から小数点表示に変換しておきます。

f:id:cross_hyou:20210131094356p:plain

glm関数でロジスティクス回帰分析をします。

f:id:cross_hyou:20210131095114p:plain

summary関数で結果をみてみます。

f:id:cross_hyou:20210131095229p:plain

pc_hは有意な変数のようです。

step関数でモデルを単純化します。

f:id:cross_hyou:20210131095501p:plain

summary関数でglm_model2を見てみましょう。

f:id:cross_hyou:20210131095655p:plain

残差プロットを描いてみます。

f:id:cross_hyou:20210131095839p:plain

f:id:cross_hyou:20210131095854p:plain

実際の値と予測値の散布図を描いてみます。

f:id:cross_hyou:20210131100111p:plain

f:id:cross_hyou:20210131100128p:plain

前回のall_model3と今回のglm_model2でどちらが当てはまりがいいのか、相関係数でみてみます。

f:id:cross_hyou:20210131100612p:plain

今回のglm_model2のほうがわずかですが相関係数は高いです。

今回は以上です。

はじめから読むには、

です。

Rで何かをしたり、読書をするブログ