の続きです。
前回の回帰分析モデルから、重要でない変数をstep関数で削除してみます。
このlm_2をsummary関数で表示してみます。
life_leisure_r: 生活・レジャー産業の割合、sonota_serv_r: その他サービス業の割合、hotel_resstau_r: 宿泊・飲食サービス業の割合の3つが残っています。sonota_serv_rのp値が0.13299と0.05よりも大きいのでこれもupdate関数で削除してみます。
anova関数で、lm_2とlm_3のモデルに違うがあるかどうかを調べます。
p値が0.133と0.05よりも大きいので、lm_2とlm_3に統計的な有意差はありません。
モデルは単純なほどいいですから、lm_3のほうがいいです。
summary関数でlm_3を見てみます。
life_leisure_rが1増えると、つまり生活・レジャー産業の割合が1ポイント増えると、売上高が302万円増えるということです。その反対にhotel_restau_rが1ポイント増えると150万円売上高が減る、ということです。
散布図を描いて、これを視覚化してみます。
グラフの右下ほど散布図の色が明るく、大きくなっているように見えます。
次に、life_leisure_rとchg_netの散布図を描いてみます。
geom_smooth関数で回帰直線のを加えてみました。life_leisure_rが大きいほど、chg_netが大きいという関係です。
hotel_restau_rとchg_netの残布図を描きます。
こちらは、回帰直線の傾きが右下がりです。hotel_restau_rが大きいほど、chg_netが小さくなります。
今回は以上です。
次回は
です。
はじめから読むには、
です。