の続きです。
前回はデータをきれいにするところまででした。まずは、summary関数でデータの基本統計値を見ます。
Yearの最小値が1980で最大値が2008なので、このデータは1980年から2008年までのデータですね。
apply関数、sd関数、mean関数をつかって各変数の変動係数を調べます。
DIの系列は0.5前後ですがCIの系列は0.1前後とDI系列のほうが変動が大きいのですね。
月別に集計して、景気の良い月、景気の悪い月というのがあるかどうか見てみましょう。
DI_C(DI一致指数)についてみてみます。tapply関数とmean関数で月別の平均値を計算します。
sort関数をつかって並び替えてみます。
一番低いのは2月で、54.04です。一番高いのは7月で58.11です。
DI_Leadについても見てみます。
DI_Leadは2月が逆に一番高いです。54.74です。一番低いのは11月です。46.88です。
DI_Lagはどうでしょうか?
6月が一番低くて51.48です。3月が一番高くで60.12です。
今度はbarplot関数で棒グラフにしてみます。
まず、Month_DI_Lead, Month_DI_C, Month_DI_Lagを一つのマトリックスにしてからbarplot関数で棒グラフにします。
こうしてみるとCが一番、各月の違いが小さく、Lagが一番大きいようですね。
aov関数でANOVA分析をしてみます。はじめはDI_Leadから
p値が0.567ですから、月による違いは統計的に有意ではないです。
次は、DI_Cです。
p値が0.77ですから、DI_Cも月に違いはありません。
最後は、DI_Lagです。
p値が0.849なので、DI_Lagも月によって違いはありません。
他のCI_~~, CIC_~~も分析してみます。for関数を使って一気にやります。
一番小さなp値でも、DIC_Lagの0.723です。
つまり、景気動向指数は月別の違いは無い、ということですね。
今回は以上です。