Generated by Bing Image Creator: A beautiful long and quiet view of cherry blossoms and rape blossoms from afar
Landscape photo
の続きです。
今回はパネルデータ分析の手法で1人当たり県民所得とパソコン所有数量の関係を調べてみましょう。まず、plmパッケージの読み込みをします。
前回のブログで作成した、df_shotokuのデータフレームをパネルデータフレームに変換します。
pdata.frame()関数で普通のデータフレームをパネルデータフレームに変換します。
pdata.frame()関数でパネルデータフレームに変換したあと、pdim()関数でその構造を確認しています。n = 47, 都道府県は47ですね、T = 3, 調査年は2004年、2009年、2014年の3か年ですね、N = 142は、47 * 3 = 147 ということです。
パネルデータフレームを作成してしまえば、あとは簡単にplm()関数で回帰分析ができます。
はじめは、プーリング法といってパネルデータとして扱わないで普通のデータとして扱って回帰分析してみます。
model = "pooling" とするとプーリング法です。
summary()関数で結果をみてみます。
shotokuの係数は0.22で統計的に有意に0とは違います。1人当たり県民所得が1千円上昇すると、千世帯当たりのパソコン所有数量が0.22台増加する、という関係です。
次は、First Differenceという方法でやってみます。model = "fd"とします。
結果をみてみます。
shotokuの係数は-0.023とわずかに負の値です。だけれども、統計的に有意にゼロとは違わないです。解釈としては、1人当たり県民所得はパソコン所有数量とは関連性が無い、ということです。
First Difference法というのは、もともと頭の中に
パソコン所有数量it = β0 + β1 * 1人当たり県民所得it + 都道府県特有値i + 誤差項it
というモデルがあって、これを推定しよう、というものです。
i は都道府県を表す添え字で、t は調査年を表す添え字です。
都道府県特有値というのは、調査年が変わっても変化しない値です。
そして、この都道府県特有値をなくすために、t と t-1の差分を取ります。
Δパソコン所有数量it = パソコン所有数量it - パソコン所有数量it-1
です。パソコン所有数量は
tのときは、β0 + β1 * 1人当たり県民所得it + 都道府県特有値i + 誤差項it
t-1のときは、β0 + β1 * 1人当たり県民所得it-1 + 都道府県特有値i + 誤差項it-1
です。上の式から下の式を引くと、都道府県特有値がなくなって
β1 * Δ1人当たり県民所得it + Δ誤差項it
となります。
つまり、
Δパソコン所有数量it = β1 * Δ1人当たり県民所得it + Δ誤差項it
としてβ1を推定しています。
First Difference法と似た方法でFixed Effect法というのがあります。この方法でもβ1を推定してみましょう。model = "whitin"とします、
summary()関数で結果をみてみます。
shotokuの係数はマイナス0.058で、統計的に有意に0とは違わないです。
Fixed Effect法による推定でも1人当たり県民所得はパソコン所有数量とは関連性は無い、という結果になりました。
1人当たり県民所得 >> パソコン所有数量
という関係ではないようです。
これは、下のグラフ
を見ると納得かと思います。
右下のピンクが2004年の所得とパソコン所有数量で、これが左の2009年の位置に移動します。つまり所得は減っているけど、パソコン所有数量は増えています。そして右上の2014年の青丸に移動します。所得が増えて、パソコン所有数量も増えた、ということです。所得が減っても増えても、年が経過してパソコン所有数量が増えている、ということですね。
今回は以上です。
次回は、
です。
初めから読むには、
です。