の続きです。
今回は、課税所得伸び率を人口伸び率、面積伸び率、行政職員伸び率の3つの変数で重回帰分析をしてみたいと思います。
まずは、散布図を見てみます。plot関数ですね。
人口伸び率はかなり相関が強そうです。面積伸び率はなさそうです。職員伸び率は若干相関がありそうです。面積伸び率、滋賀県大津市という大きな外れ値があるので、散布図がよくわからないですね。どうしましょうか?そもそも、滋賀県大津市の伸び率は標準偏差でどのくらい平均値から外れているのかな?
標準偏差の7.7倍も平均値から離れています!どうしましょうか?外れ値の値を平均値 + 2標準偏差に置き換えてみて散布図を描いてみましょう。
山梨県甲府市と滋賀県大津市が外れ値でしたね。
どうでしょうか?やっぱり相関はなさそうですね
それでは回帰分析をしてみます。

Statistics: An Introduction Using R
- 作者: Michael J. Crawley
- 出版社/メーカー: Wiley
- 発売日: 2014/11/24
- メディア: ペーパーバック
- この商品を含むブログを見る
こちらの本を参考にやってみます。
まずは、gam関数でGeneralized Additive Modelというのをやってみます。
人口伸び率は関係ありそうですが、面積伸び率、職員伸び率は関係なさそうですね。
それでは、lm関数で重回帰分析をします。
p-valueは2.2e-16より小さいので有意なモデルです。GrPopu:GrGyouは必要なさそうですね。削除します。
p-value < 2.2e-16なので有意なモデルです。GrAre2:GrGyouはいらないようです。
p-value < 2.2e-16なので有意です。I(GrGyou^2)はいらないようです。
p-value < 2.2e-16なので有意なモデルです。I(GrAre2^2)はいらないようです。
p-value < 2.2e-16なので有意なモデルです。GreAre2のp値が0.0899と0.05よりも大きいのですが、GrPopu:GrAre2, GrPopu:GrAre2:GrGyouが有意なので外しません。
model5の当てはまり具合をグラフにします。
今回は以上です。