www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気動向指数の長期系列データの分析５ - R言語を使って、DI一致指数をDI先行指数とDI遅行指数で回帰分析をする。lm関数、gam関数、rpart関数を使って。

データ分析

www.crosshyou.info

の続きです。

今回は、DI_C(DI一致指数)をDI_Lead(DI先行指数)とDI_Lag(DI遅行指数)で回帰分析してみようと思います。

lm関数を使ってみます。

f:id:cross_hyou:20200213195119p:plain

DI_Lead:DI_Lagはp値が0.39と0.05よりも大きいので、削除してモデルをより単純化します。

f:id:cross_hyou:20200213195333p:plain

anova関数でmodel1とmodel2を比較しました。p値が0.3964と0.05よりも大きいですので、model2とmodel1では有意な違いはありません。なので、より単純なmodel2を採用します。

f:id:cross_hyou:20200213195529p:plain

I(DI_Lead^2)を削除しましょう。

f:id:cross_hyou:20200213195706p:plain

model2とmodel3では有意な違いはありません。より単純なmodel3を採用します。

f:id:cross_hyou:20200213195826p:plain

I(DI_Lag^2)を削除しましょう。

f:id:cross_hyou:20200213200016p:plain

model4を採用します。

f:id:cross_hyou:20200213200116p:plain

これ以上は単純化できないですね。このmodel4がどのくらいあてはまっているか、実際の値から予測値を引いて、それを2乗して、それを合計した値を計算しておきます。

f:id:cross_hyou:20200213200655p:plain

次はGeneralized Additive Modelというのをやってみます。

f:id:cross_hyou:20200213200937p:plain

plot関数でグラフにします。

f:id:cross_hyou:20200213201813p:plain

f:id:cross_hyou:20200213201826p:plain

このgamモデルも実際の値と予測値の差の2乗の合計を計算しておきます。

f:id:cross_hyou:20200213201227p:plain

次は、rpart関数で決定木モデルを使ってみます。

f:id:cross_hyou:20200213201549p:plain

これもグラフにしましょう。

f:id:cross_hyou:20200213202036p:plain

f:id:cross_hyou:20200213202048p:plain

決定木モデルはグラフにするとわかりやすいですね。

これもどのくらいあてはまっているかの数値を計算します。

f:id:cross_hyou:20200213202758p:plain

lm関数(線形回帰モデル), gam関数(Generalized Additive Model), rpart(tree model)のそれぞれのどれくらいあてはまっているかの数値をみてみましょう。

f:id:cross_hyou:20200213203204p:plain

決定木モデルが1番で、2番目がGeneralized Additive Modelで、3番目が線形回帰モデルというあてはまりの良さですね。

今回は以上です。