の続きです。
いままでは、都道府県別のデータを使って分析してきました。
今回は年別の平均値を使って、時系列データの分析をしてみます。
まずは、年別の平均値のデータフレームを作ります。
2001年から2014年まで、14年間のデータです。
これを、ts()関数で時系列のデータオブジェクトに変換します。
このtsオブジェクトはplot()関数でグラフを描くと、下図のようになります。
データフレームオブジェクトをplot()でグラフを描くと下図のようになります。
tsオブジェクトは時系列の線グラフになって、dataframeオブジェクトは散布図のグラフになります。
変数間の相関係数を見てみます。
Gdp: 一人当たりの県内総生産額 と正の相関が一番強いのはP_ratioですね。
Gdp = beta_0 + beta_1 * Ed + beta_2 * P_ratio + u というモデルを回帰分析してみます。
ラグが無いので、staticモデルです。
はじめに、dynlmパッケージの読み込みをして時系列データ用の回帰分析の関数、dynlm()関数を使えるようにしておきます。
Edは10%水準で有意、P_ratioは5%水準で有意です。
せっかくdynlm()関数を使っていいますので、トレンド変数も加えてみます。
trend()というのでトレンド変数を作ることができます。
トレンドを追加すると、Edは有意ではなくなりましたが、P_ratioは5%水準で有意ですね。全体の教育費、Edが同じなら、P_ratioが増えるとGdpが増えるということは、都道府県ベースの教育費のほうが市町村ベースの教育費よりも一人当たりの県内総生産額を増やす効果がある、ということですかね。
L()というのでラグ変数も追加できるので、追加したモデル式を考えてみましょう。
ラグの変数は、あまり追加する意味はなさそうな感じですね。
stargazerパッケージのstargazer()関数を使って、今回作成した3つのモデル式を一覧表にしてみます。
今回は以上です。
次回は、
です。
初めから読むには、
です。