今回は景気ウォッチャーのデータの分析をしてみようと思います。
内閣府のウェブからデータを取得しました。
ここからエクセルをダウンロードして、今回は、地域別(現状)のデータを使います。
R言語に読込ませるように、少し加工しました。
これをR言語で読込みます。
こうなりました。
このような形式のデータはよくないですよね。本当は、
こういう形式になってないといけないですよね。
どうやって変換するのかな。。。
str関数の結果を見ると、obsは216あります。216/12=18なので2002年から2019年までの18年間のデータですね。variablesが17で、そのうち二つはYearとMonthですから地域は15地域あります。ということは、Yearは一つの年で、12か月 x 15地域 = 180必要です。1年につき180で2002年から2019年まで18年ですから、データの長さは、180 x 18 = 3240です。rep関数をYEARという変数を作成します。
これでいいですね。
つぎは、MONTHという変数をつくりましょう。1月が15地域、2月が15地域、、、11月が15地域、12月が15地域、これを18回繰り返します。
これでいいですね。
REGIONは15の地域を3240 / 15 = 216回繰り返します。
これでいいですね。
最後の景気ウォッチャーの値ですが、これは横方向にデータを並べればいいですね。
でも、Rは普通は縦方向にデータを読込みますので、縦横を変換する必要があります。
いいですね。
これで、分析のためのデータフレームができます。
できましたね。
この新しいデータフレーム、dfaが正しく作成されているか確認してみましょう。
もともとのdfで地域別の平均値を出してみます。apply関数とmean関数を使います。
新しいデータフレーム、dfaから地域別の平均値を計算します。tapply関数とmean関数を使います。
並びは違いますが、値は同じです。
これで、データ分析用のデータフレーム、dfaができました。
今回は以上です。