www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析3 - 課税所得を他の変数で重回帰分析する。

 

www.crosshyou.info

 の続きです。

今回は、課税所得伸び率を人口伸び率、面積伸び率、行政職員伸び率の3つの変数で重回帰分析をしてみたいと思います。

まずは、散布図を見てみます。plot関数ですね。

f:id:cross_hyou:20190822194739j:plain

f:id:cross_hyou:20190822194751j:plain



人口伸び率はかなり相関が強そうです。面積伸び率はなさそうです。職員伸び率は若干相関がありそうです。面積伸び率、滋賀県大津市という大きな外れ値があるので、散布図がよくわからないですね。どうしましょうか?そもそも、滋賀県大津市の伸び率は標準偏差でどのくらい平均値から外れているのかな?

f:id:cross_hyou:20190822195147j:plain


標準偏差の7.7倍も平均値から離れています!どうしましょうか?外れ値の値を平均値 + 2標準偏差に置き換えてみて散布図を描いてみましょう。

f:id:cross_hyou:20190822195601j:plain

f:id:cross_hyou:20190822195625j:plain

山梨県甲府市と滋賀県大津市が外れ値でしたね。

どうでしょうか?やっぱり相関はなさそうですね

それでは回帰分析をしてみます。

 

Statistics: An Introduction Using R

Statistics: An Introduction Using R

 

 こちらの本を参考にやってみます。

まずは、gam関数でGeneralized Additive Modelというのをやってみます。

f:id:cross_hyou:20190822195929j:plain

f:id:cross_hyou:20190822195940j:plain


人口伸び率は関係ありそうですが、面積伸び率、職員伸び率は関係なさそうですね。

それでは、lm関数で重回帰分析をします。

f:id:cross_hyou:20190822200942j:plain

 

p-valueは2.2e-16より小さいので有意なモデルです。GrPopu:GrGyouは必要なさそうですね。削除します。

f:id:cross_hyou:20190822201321j:plain

p-value < 2.2e-16なので有意なモデルです。GrAre2:GrGyouはいらないようです。

f:id:cross_hyou:20190822201535j:plain

p-value < 2.2e-16なので有意です。I(GrGyou^2)はいらないようです。

f:id:cross_hyou:20190822201727j:plain

p-value < 2.2e-16なので有意なモデルです。I(GrAre2^2)はいらないようです。

f:id:cross_hyou:20190822201953j:plain

p-value < 2.2e-16なので有意なモデルです。GreAre2のp値が0.0899と0.05よりも大きいのですが、GrPopu:GrAre2, GrPopu:GrAre2:GrGyouが有意なので外しません。

model5の当てはまり具合をグラフにします。

f:id:cross_hyou:20190822202321j:plain

f:id:cross_hyou:20190822202333j:plain

今回は以上です。