Photo by Boris Smokrovic on Unsplash
の続きです。
前回は、東京都の人口百万人当たりのあんま・マッサージ師の数を説明する時系列の回帰分析モデルを作成しました。どのモデルでも、はり・きゅう師の数が多いとあんま・マッサージ師の数も多く、柔道整復師の数が多いとあんま・マッサージ師の数は少なくなる、というモデルでした。
時系列の回帰モデルではきを付けなければいけないのは、残差が系列相関しているかどうかです。今回はそれぞれのモデルで残差が系列相関をしているかどうかを調べます。
準備として、lmtestパッケージの読み込みをします。
一番はじめのモデル、tsmodel1から調べます。
こういう単純なモデルです。残差をプロットして目で見てみます。
横軸が残差(t)で縦軸が残差(t-1)の散布図です。正の相関がある感じですね。
lmtestパッケージのcoeftest()関数で確認します。
p値が0に近いので、系列相関は無いという帰無仮説を棄却します。
次は、トレンドを追加したts_trend_modelです。モデルは
このようなものでした。
残差の散布図を描いてみましょう。
pch = 2 で△になり、col = 2 で赤くなります。この散布図も正の相関がある感じですね。
coeftest()関数で確認します。
1%以下の水準で有意です。系列相関しています。
次は、ラグ変数を追加したモデルです。
このように、harikyu_pop, judo_popのラグを追加しています。
残差の散布図をみます。
pch = 3 で +、col = 3 で緑になります。これも正の相関がある感じです。
coeftest()で確認してみます。
p-valueは0.00454です。前の2つよりはp値は大きくなりましたが、まだまだ十分に系列相関があることがわかります。
次のモデルは、
差分で回帰分析したモデルです。
残差をプロットしてみます。
pch = 4 だと X になります。col = 4 だと青ですね。これはあきらかに系列相関していますね。
coeftest()関数で検定します。
p値はほぼ小数点以下7桁までゼロです。
最後のモデルは、トレンド、ラグ、差分が入ったモデルです。
残差をプロットしてみます。
pch = 5 で◇ になるのですね。col = 5 でライトブルーかな?エメラルドグリーンかな?
これは、けっこうバラバラで相関が無い感じですね。
coeftest()関数で検定します。
p値が0.1336となりましたので、10%の有意水準で H0: 残差が系列相関していない を棄却できないです。ts_full_model は信頼してもよさそうです。
今回は以上です。
次回は
です。
初めから読むには、
です。