Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の教育費のデータの分析8 - Rで時系列データの分析。回帰式のモデルにトレンド変数やラグ変数を追加する。

Photo by Redd on Unsplash 

www.crosshyou.info

の続きです。

いままでは、都道府県別のデータを使って分析してきました。

今回は年別の平均値を使って、時系列データの分析をしてみます。

まずは、年別の平均値のデータフレームを作ります。

2001年から2014年まで、14年間のデータです。

 

これを、ts()関数で時系列のデータオブジェクトに変換します。

このtsオブジェクトはplot()関数でグラフを描くと、下図のようになります。

データフレームオブジェクトをplot()でグラフを描くと下図のようになります。

tsオブジェクトは時系列の線グラフになって、dataframeオブジェクトは散布図のグラフになります。

変数間の相関係数を見てみます。

Gdp: 一人当たりの県内総生産額 と正の相関が一番強いのはP_ratioですね。

Gdp = beta_0 + beta_1 * Ed + beta_2 * P_ratio + u というモデルを回帰分析してみます。

ラグが無いので、staticモデルです。

はじめに、dynlmパッケージの読み込みをして時系列データ用の回帰分析の関数、dynlm()関数を使えるようにしておきます。

Edは10%水準で有意、P_ratioは5%水準で有意です。

せっかくdynlm()関数を使っていいますので、トレンド変数も加えてみます。

trend()というのでトレンド変数を作ることができます。

トレンドを追加すると、Edは有意ではなくなりましたが、P_ratioは5%水準で有意ですね。全体の教育費、Edが同じなら、P_ratioが増えるとGdpが増えるということは、都道府県ベースの教育費のほうが市町村ベースの教育費よりも一人当たりの県内総生産額を増やす効果がある、ということですかね。

L()というのでラグ変数も追加できるので、追加したモデル式を考えてみましょう。

ラグの変数は、あまり追加する意味はなさそうな感じですね。

stargazerパッケージのstargazer()関数を使って、今回作成した3つのモデル式を一覧表にしてみます。

今回は以上です。

次回は、

www.crosshyou.info

です。

初めから読むには、

 

www.crosshyou.info

です。