www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気ウォッチャー調査地域別(現状)のデータの分析3 - R言語で年をファクタに見立ててANOVA分析

 

www.crosshyou.info

 の続きです。

今回は年をファクタに見立ててANOVA分析をしてみたいと思います。

まずは、前回の続き、年別の平均値を見てみましょう。tapply関数、mean関数で年別の平均値を計算して、round関数で小数点以下2桁でまるめています。

f:id:cross_hyou:20200123190835p:plain

2005年、2006年、2013年、2017年は50を超えていますが、2008年は30以下となっています。

それでは、この年、dfa$Yをファクタにした変数を用意してANOVAをしてみましょう。

f:id:cross_hyou:20200123191228p:plain

factor関数でファクタにして、levels関数でファクタのレベルを確認しました。

ANOVAはaov関数を使います。

f:id:cross_hyou:20200123192555p:plain

p値(Pr(>F)のところ)が、<2e-16と0.05よりも小さいので、年によって景気ウォッチャー(現状)の平均値は違うことがわかりました。

summary.lm関数でどの年が違っているのか見てみます。

f:id:cross_hyou:20200123192752p:plain

InterceptのEstimateの値が40.79です。これは2002年の平均値が40.79だということですね。そして他のものすべてこの2002年の平均値からどのくらい違うか、ということです。よく見ると、2004年が9.3922で2005年が9.4544とほとんど違いがありません。2004年と2005年は一緒にしても大丈夫ですね。

f:id:cross_hyou:20200123193603p:plain


fYaという名前でファクタをつくりました。2004と2005が一緒になって、2004+05という名前のファクタになりました。このファクタでANOVA分析です。

f:id:cross_hyou:20200123193827p:plain

aov関数でANOVAのモデル、model2をつくり、model1とmodel2で違いがあるかどうかanova関数で確認しました。p値が0.9028なので有意な違いは無いです。

model2を見てみます。

f:id:cross_hyou:20200123194147p:plain

2011年が2.5494で、2019年が2.5817なので一緒にできそうです。

f:id:cross_hyou:20200123194440p:plain

fYbでANOVAをします。aov関数です。

f:id:cross_hyou:20200123194602p:plain

model2とmodel3では有意な違いは無いですね。model3を見てみます。

f:id:cross_hyou:20200123194758p:plain

2010年が4.4761で2016年が4.7011なので一緒にしてみます。

f:id:cross_hyou:20200123195041p:plain

aov関数でANOVAです。

f:id:cross_hyou:20200123195202p:plain

p値は0.6587なので、model3とmodel4で有意な違いはありません。model4を見てみます。

f:id:cross_hyou:20200123195359p:plain

2010+16が4.5886で、2012が4.2378なので一緒にできそうです。

f:id:cross_hyou:20200123195850p:plain
aov関数でANOVAです。

f:id:cross_hyou:20200123200009p:plain

p値は0.4264なのでmodel4とmodel5では有意な違いはありません。

model5を見てみます。

f:id:cross_hyou:20200123200225p:plain

2003年が2.8556で、11+19が2.5656なので一緒にします。

f:id:cross_hyou:20200123200523p:plain

fYeでANOVAです。aov関数を使います。

f:id:cross_hyou:20200123200651p:plain

p値は0.5109なのでmodel5とmodel6は有意な違いはありません。

model6を見てみます。

f:id:cross_hyou:20200123200842p:plain

2004+05が9.4233で、2015が9.000なので一緒にできそうです。

f:id:cross_hyou:20200123201132p:plain

fYfでANOVAです。aov関数です。

f:id:cross_hyou:20200123201257p:plain

p値は0.3371なので、model6とmodel7では有意な違いはありません。

model7を見てみます。

f:id:cross_hyou:20200123201450p:plain

2004+05+15が9.2822で、2017が9.710なので一緒にできそうです。

f:id:cross_hyou:20200123201816p:plain

fYgでANOVAです。aov関数です。

f:id:cross_hyou:20200123202008p:plain

p値は0.3036ですのでmodel8とmodel7は有意な違いはないです。

model8を見てみます。

f:id:cross_hyou:20200123202217p:plain

2007が3.9922で、2010+12+16が4.4717なので一緒にできそうです。

f:id:cross_hyou:20200123202521p:plain

fYhでANOVAをします。

f:id:cross_hyou:20200123202707p:plain

p値は0.2489です。model9を見てみましょう。

f:id:cross_hyou:20200123202839p:plain

Std. Errorの値の2倍以下の違いしか無いファクタ水準は一緒にできる可能性が高いです。2014と2018を一緒にしましょう。

f:id:cross_hyou:20200123203126p:plain

fYiでANOVAをします。

f:id:cross_hyou:20200123203247p:plain

p値は0.1487なので、model9とmodel10では有意な違いは無いです。

model10を見てみます。

f:id:cross_hyou:20200123203432p:plain

2004+05;15+17が9.3892で、2006が10.5789です。ちょっと微妙ですが一緒にしてみましょう。

f:id:cross_hyou:20200123203731p:plain

fYjでANOVAです。

f:id:cross_hyou:20200123203847p:plain

p値は0.003152と0.05より小さいので、model10とmodel11は有意な違いがあります。model11は年を一緒にしすぎたということですね。

つまり、model10が最終的なANOVAのモデルです。

barplot関数で棒グラフにしてみましょう。

f:id:cross_hyou:20200123204339p:plain

f:id:cross_hyou:20200123204352p:plain

2008年、2009年は景気が悪かったんですね。今回は以上です。