Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の建築物リフォーム・リニューアル調査のデータ分析9 - Rでパネルデータ分析

UnsplashYouSsef NaDramが撮影した写真 

www.crosshyou.info

の続きです。前回は、l_total: リフォーム・リニューアルの金額の自然対数値を被説明変数、l_shotoku23: 県民1人当たり所得の自然対数値、l_total_prev: 前年のl_total、yearを説明変数にして回帰分析をしました。その結果、県民1人当たり所得はリフォーム・リニューアルの金額には関係があるとはいえない、という結果になりました。

今回、パネルデータ分析用のパッケージ、plmを使って、前回と同じことがもっと簡単にできることと、その他のパネルデータの回帰分析手法を試してみたいと思います。

まずは、plmパッケージの読み込みをします。

そうしたら、pdata.frame()関数でパネルデータフレームを作成します。

pdim()関数でパネルデータフレームになっていることを確認します。

n = 47は47の都道府県があることを表しています。T = 3 は2016, 2017, 2018年度の3つの年度があることを表しています。N = 141 は47 x 3 = 141 で141個の観測値があることを表しています。Balanced Panelは、47個の都道府県が全て3年間のデータがある、ということですね。

このdf_pがどんな様子なのか、みてみます。

このように、一番左に1-2016. 1-2017, 1-2018, 2-2016, 2-2017と表示されています。1が北海道、2が青森で、2016年度、2017年度、2018年度とわかるようになっています。

1年前のデータを作るのは、lag()関数で簡単にできます。

本当にできているか確認します。

このように、ちゃんとできています。

あとは、lm()関数で普通に回帰分析できます。

前回と全く同じ結果です。(47個の観測値が欠損のため削除されました)というところだけ違いますね。

パネルデータでの回帰分析では、First Difference Method, Fixed Effect Method, Random Effect Methodというのがあります。これらは、plm()関数で簡単にできます。

First Differenceはmodel = "fd"で、Fixed Effectはmodel = "within"で、Random Effectはmodel = "random"で可能です。

stargazer()パッケージを使って、3つの推定結果を出力します。

Random Effectのl_totalの係数は3.635で統計的に有意ですが、First Difference, Fixed Effectのl_totalの係数は0に近く、統計的に有意ではないですね。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。