www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全国主要都市の第1次、第2次、第3次産業就業者数のデータ分析8 - 1人当り課税所得の変化幅を回帰分析する。

 

www.crosshyou.info

 今回はchgperInc, 1人当り課税所得の変化幅を他の変数で回帰分析してみようと思います。

前回の散布図マトリックスから、直線的な相関関係というよりは複雑な関係がありそうなので、交差項や2乗項を入れて回帰分析してみます。

f:id:cross_hyou:20200523153746j:plain

step関数で単純化しましょう。

f:id:cross_hyou:20200523154048j:plain

chgRatio1:chgRatio2を削除してみます。

f:id:cross_hyou:20200523154306j:plain

model2とmodel3をanova関数で比較します。

f:id:cross_hyou:20200523154445j:plain

Pr(>F)が0.05693と0.05よりも大きいのでmodel2とmodel3には有意な差はありません。なので、単純なほうのmodel3がいいモデルです。model3の係数を見てみます。

f:id:cross_hyou:20200523154743j:plain

どの係数もプラスの値です。chgMitsuが大きければ大きいほど、chgRatio1が大きければ大きいほど、chgRatio2が大きければ大きいほどchgperIncは大きいということですね。

実際のchgperIncとmodel3の予測値を散布図でプロットしてみます。

f:id:cross_hyou:20200523155533j:plain

f:id:cross_hyou:20200523155542j:plain

あまり良い予測精度ではないですね。

残差もプロットしてみます。

f:id:cross_hyou:20200523161936j:plain

f:id:cross_hyou:20200523161953j:plain

chgperIncの値が大きいほど残差が大きくなっていますね。。これはよくないので、chgperIncを対数変換してみましょう。

f:id:cross_hyou:20200523160923j:plain

このlogchgperIncをresponse variablesにして回帰分析してみます。

f:id:cross_hyou:20200523161200j:plain

残差プロットを描いてみます。

f:id:cross_hyou:20200523162121j:plain

f:id:cross_hyou:20200523162223j:plain

少しましな感じになりました。

今回は以上です。