の続きです。
今回は年をファクタに見立ててANOVA分析をしてみたいと思います。
まずは、前回の続き、年別の平均値を見てみましょう。tapply関数、mean関数で年別の平均値を計算して、round関数で小数点以下2桁でまるめています。
2005年、2006年、2013年、2017年は50を超えていますが、2008年は30以下となっています。
それでは、この年、dfa$Yをファクタにした変数を用意してANOVAをしてみましょう。
factor関数でファクタにして、levels関数でファクタのレベルを確認しました。
ANOVAはaov関数を使います。
p値(Pr(>F)のところ)が、<2e-16と0.05よりも小さいので、年によって景気ウォッチャー(現状)の平均値は違うことがわかりました。
summary.lm関数でどの年が違っているのか見てみます。
InterceptのEstimateの値が40.79です。これは2002年の平均値が40.79だということですね。そして他のものすべてこの2002年の平均値からどのくらい違うか、ということです。よく見ると、2004年が9.3922で2005年が9.4544とほとんど違いがありません。2004年と2005年は一緒にしても大丈夫ですね。
fYaという名前でファクタをつくりました。2004と2005が一緒になって、2004+05という名前のファクタになりました。このファクタでANOVA分析です。
aov関数でANOVAのモデル、model2をつくり、model1とmodel2で違いがあるかどうかanova関数で確認しました。p値が0.9028なので有意な違いは無いです。
model2を見てみます。
2011年が2.5494で、2019年が2.5817なので一緒にできそうです。
fYbでANOVAをします。aov関数です。
model2とmodel3では有意な違いは無いですね。model3を見てみます。
2010年が4.4761で2016年が4.7011なので一緒にしてみます。
aov関数でANOVAです。
p値は0.6587なので、model3とmodel4で有意な違いはありません。model4を見てみます。
2010+16が4.5886で、2012が4.2378なので一緒にできそうです。
aov関数でANOVAです。
p値は0.4264なのでmodel4とmodel5では有意な違いはありません。
model5を見てみます。
2003年が2.8556で、11+19が2.5656なので一緒にします。
fYeでANOVAです。aov関数を使います。
p値は0.5109なのでmodel5とmodel6は有意な違いはありません。
model6を見てみます。
2004+05が9.4233で、2015が9.000なので一緒にできそうです。
fYfでANOVAです。aov関数です。
p値は0.3371なので、model6とmodel7では有意な違いはありません。
model7を見てみます。
2004+05+15が9.2822で、2017が9.710なので一緒にできそうです。
fYgでANOVAです。aov関数です。
p値は0.3036ですのでmodel8とmodel7は有意な違いはないです。
model8を見てみます。
2007が3.9922で、2010+12+16が4.4717なので一緒にできそうです。
fYhでANOVAをします。
p値は0.2489です。model9を見てみましょう。
Std. Errorの値の2倍以下の違いしか無いファクタ水準は一緒にできる可能性が高いです。2014と2018を一緒にしましょう。
fYiでANOVAをします。
p値は0.1487なので、model9とmodel10では有意な違いは無いです。
model10を見てみます。
2004+05;15+17が9.3892で、2006が10.5789です。ちょっと微妙ですが一緒にしてみましょう。
fYjでANOVAです。
p値は0.003152と0.05より小さいので、model10とmodel11は有意な違いがあります。model11は年を一緒にしすぎたということですね。
つまり、model10が最終的なANOVAのモデルです。
barplot関数で棒グラフにしてみましょう。
2008年、2009年は景気が悪かったんですね。今回は以上です。