Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のパソコン所有数量のデータ分析4 - Rでパネルデータ分析 - 1人当たり県民所得とパソコン所有数量の関係

Generated by Bing Image Creator: A beautiful long and quiet view of cherry blossoms and rape blossoms from afar
Landscape photo

www.crosshyou.info

の続きです。

今回はパネルデータ分析の手法で1人当たり県民所得とパソコン所有数量の関係を調べてみましょう。まず、plmパッケージの読み込みをします。

前回のブログで作成した、df_shotokuのデータフレームをパネルデータフレームに変換します。

pdata.frame()関数で普通のデータフレームをパネルデータフレームに変換します。

pdata.frame()関数でパネルデータフレームに変換したあと、pdim()関数でその構造を確認しています。n = 47, 都道府県は47ですね、T = 3, 調査年は2004年、2009年、2014年の3か年ですね、N = 142は、47 * 3 = 147 ということです。

パネルデータフレームを作成してしまえば、あとは簡単にplm()関数で回帰分析ができます。

はじめは、プーリング法といってパネルデータとして扱わないで普通のデータとして扱って回帰分析してみます。

model = "pooling" とするとプーリング法です。

summary()関数で結果をみてみます。

shotokuの係数は0.22で統計的に有意に0とは違います。1人当たり県民所得が1千円上昇すると、千世帯当たりのパソコン所有数量が0.22台増加する、という関係です。

次は、First Differenceという方法でやってみます。model = "fd"とします。

結果をみてみます。

shotokuの係数は-0.023とわずかに負の値です。だけれども、統計的に有意にゼロとは違わないです。解釈としては、1人当たり県民所得はパソコン所有数量とは関連性が無い、ということです。

First Difference法というのは、もともと頭の中に

パソコン所有数量it = β0 + β1 * 1人当たり県民所得it + 都道府県特有値i + 誤差項it

というモデルがあって、これを推定しよう、というものです。

i は都道府県を表す添え字で、t は調査年を表す添え字です。

都道府県特有値というのは、調査年が変わっても変化しない値です。

そして、この都道府県特有値をなくすために、t と t-1の差分を取ります。

Δパソコン所有数量it = パソコン所有数量it - パソコン所有数量it-1

です。パソコン所有数量は

tのときは、β0 + β1 * 1人当たり県民所得it + 都道府県特有値i + 誤差項it

t-1のときは、β0 + β1 * 1人当たり県民所得it-1 + 都道府県特有値i + 誤差項it-1

です。上の式から下の式を引くと、都道府県特有値がなくなって

β1 * Δ1人当たり県民所得it + Δ誤差項it

となります。

つまり、

Δパソコン所有数量it = β1 * Δ1人当たり県民所得it + Δ誤差項it

としてβ1を推定しています。

First Difference法と似た方法でFixed Effect法というのがあります。この方法でもβ1を推定してみましょう。model = "whitin"とします、

summary()関数で結果をみてみます。

shotokuの係数はマイナス0.058で、統計的に有意に0とは違わないです。

Fixed Effect法による推定でも1人当たり県民所得はパソコン所有数量とは関連性は無い、という結果になりました。

1人当たり県民所得 >> パソコン所有数量

という関係ではないようです。

これは、下のグラフ

を見ると納得かと思います。

右下のピンクが2004年の所得とパソコン所有数量で、これが左の2009年の位置に移動します。つまり所得は減っているけど、パソコン所有数量は増えています。そして右上の2014年の青丸に移動します。所得が増えて、パソコン所有数量も増えた、ということです。所得が減っても増えても、年が経過してパソコン所有数量が増えている、ということですね。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。