www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の個人企業経済調査のデータの分析６ - R言語で回帰分析をする。生活・レジャー産業の割合が高いほど、宿泊・飲食サービス産業の割合が低いほど、1企業当たりの売上高は伸びた。

データ分析

www.crosshyou.info

の続きです。

前回の回帰分析モデルから、重要でない変数をstep関数で削除してみます。

f:id:cross_hyou:20210320093740p:plain

このlm_2をsummary関数で表示してみます。

f:id:cross_hyou:20210320093840p:plain

life_leisure_r: 生活・レジャー産業の割合、sonota_serv_r: その他サービス業の割合、hotel_resstau_r: 宿泊・飲食サービス業の割合の3つが残っています。sonota_serv_rのp値が0.13299と0.05よりも大きいのでこれもupdate関数で削除してみます。

f:id:cross_hyou:20210320094121p:plain

anova関数で、lm_2とlm_3のモデルに違うがあるかどうかを調べます。

f:id:cross_hyou:20210320094225p:plain

p値が0.133と0.05よりも大きいので、lm_2とlm_3に統計的な有意差はありません。

モデルは単純なほどいいですから、lm_3のほうがいいです。

summary関数でlm_3を見てみます。

f:id:cross_hyou:20210320094451p:plain

life_leisure_rが1増えると、つまり生活・レジャー産業の割合が1ポイント増えると、売上高が302万円増えるということです。その反対にhotel_restau_rが1ポイント増えると150万円売上高が減る、ということです。

散布図を描いて、これを視覚化してみます。

f:id:cross_hyou:20210320095141p:plain

f:id:cross_hyou:20210320095157p:plain

グラフの右下ほど散布図の色が明るく、大きくなっているように見えます。

次に、life_leisure_rとchg_netの散布図を描いてみます。

f:id:cross_hyou:20210320095409p:plain

f:id:cross_hyou:20210320095425p:plain

geom_smooth関数で回帰直線のを加えてみました。life_leisure_rが大きいほど、chg_netが大きいという関係です。

hotel_restau_rとchg_netの残布図を描きます。

f:id:cross_hyou:20210320095714p:plain

f:id:cross_hyou:20210320095729p:plain

こちらは、回帰直線の傾きが右下がりです。hotel_restau_rが大きいほど、chg_netが小さくなります。

今回は以上です。

次回は

www.crosshyou.info

です。

はじめから読むには、

www.crosshyou.info

です。