今回はchgperInc, 1人当り課税所得の変化幅を他の変数で回帰分析してみようと思います。
前回の散布図マトリックスから、直線的な相関関係というよりは複雑な関係がありそうなので、交差項や2乗項を入れて回帰分析してみます。
step関数で単純化しましょう。
chgRatio1:chgRatio2を削除してみます。
model2とmodel3をanova関数で比較します。
Pr(>F)が0.05693と0.05よりも大きいのでmodel2とmodel3には有意な差はありません。なので、単純なほうのmodel3がいいモデルです。model3の係数を見てみます。
どの係数もプラスの値です。chgMitsuが大きければ大きいほど、chgRatio1が大きければ大きいほど、chgRatio2が大きければ大きいほどchgperIncは大きいということですね。
実際のchgperIncとmodel3の予測値を散布図でプロットしてみます。
あまり良い予測精度ではないですね。
残差もプロットしてみます。
chgperIncの値が大きいほど残差が大きくなっていますね。。これはよくないので、chgperIncを対数変換してみましょう。
このlogchgperIncをresponse variablesにして回帰分析してみます。
残差プロットを描いてみます。
少しましな感じになりました。
今回は以上です。