の続きです。
今回は、DI_C(DI一致指数)をDI_Lead(DI先行指数)とDI_Lag(DI遅行指数)で回帰分析してみようと思います。
lm関数を使ってみます。
DI_Lead:DI_Lagはp値が0.39と0.05よりも大きいので、削除してモデルをより単純化します。
anova関数でmodel1とmodel2を比較しました。p値が0.3964と0.05よりも大きいですので、model2とmodel1では有意な違いはありません。なので、より単純なmodel2を採用します。
I(DI_Lead^2)を削除しましょう。
model2とmodel3では有意な違いはありません。より単純なmodel3を採用します。
I(DI_Lag^2)を削除しましょう。
model4を採用します。
これ以上は単純化できないですね。このmodel4がどのくらいあてはまっているか、実際の値から予測値を引いて、それを2乗して、それを合計した値を計算しておきます。
次はGeneralized Additive Modelというのをやってみます。
plot関数でグラフにします。
このgamモデルも実際の値と予測値の差の2乗の合計を計算しておきます。
次は、rpart関数で決定木モデルを使ってみます。
これもグラフにしましょう。
決定木モデルはグラフにするとわかりやすいですね。
これもどのくらいあてはまっているかの数値を計算します。
lm関数(線形回帰モデル), gam関数(Generalized Additive Model), rpart(tree model)のそれぞれのどれくらいあてはまっているかの数値をみてみましょう。
決定木モデルが1番で、2番目がGeneralized Additive Modelで、3番目が線形回帰モデルというあてはまりの良さですね。
今回は以上です。