Photo by Allyson Beaucourt on Unsplash
の続きです。
前回の分析で、年や月は統計的に有意な影響を価格には及ぼしていないことがわかりました。
今回は一番高い価格の外車のデータに絞って、時系列分析をしてみます。
まず、外車だけのデータセットを作ります。
name_code, nameは不要なので、削除します。
ts()関数で時系列データに変換します。
arrange()関数でtime_codeを昇順に並びかえてから、ts()関数で時系列データを作りました。
時系列データでplot()関数を実行すると、
とこのように簡単に時系列のチャートになります。
時系列データを回帰分析するためのdynlmパッケージの読み込みをします。
とりあえず、今月の価格 = b0 + b1*前月の価格 + u というモデルを分析してみましょう。
dynlmパッケージのdynlm()関数でOLSの回帰分析ができます。その際にL()というのを使うと、一つ前のデータになります。
係数がe+04などがついていて見にくいので、見やすいように表示してみます。
切片が90486, 傾きが0.97875とありますので、モデル式は、
今月の価格 = 90486 + 0.97875 * 前月の価格 + 誤差項
ということですね。
dynlm()関数では、trend()というのを使うと時系列データのトレンドを考慮することができます。
トレンドのp値は0.609とありますので、有意な係数ではないようです。
e+03などを使わないで各変数の係数の値を見ましょう。
season()を使うと季節性を考慮できます。
季節、各月のp値は0.05よりも大きいですね。各月も価格には有意ではないようです。
これは、前回の分析(年や月は有意ではない)と整合していますね。
切片と傾きの係数をe+04などを使わないで表示します。
最後に3つのモデルの傾きの係数を並べて表示してみます。
今回は以上です。
次回は
です。
初めから読むには、
です。