Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

日銀の短観データの分析2 - R言語でANOVA。最近と先行きに違いはある。先行きのほうが悲観的。

 

www.crosshyou.info

 の続きです。今回もANOVAです。explanatoly variables(説明変数)をType(最近、先行きの2値をとるカテゴリカル変数)にresponse variable(反応変数)はValue(短観の値)です。

まずは、前回と同じくグラフで見てみます。

f:id:cross_hyou:20191009081425j:plain

f:id:cross_hyou:20191009081509j:plain

黒い点が最近、赤い点が先行きです。黒の水平線が最近の平均値、赤の水平線が先行きの平均値です。

tapply関数でそれぞれの平均値を求めてみます。

f:id:cross_hyou:20191009081956j:plain

先行きの平均値は、最近の半分以下ですね。

では、SSY、the sum of the squares of the differences between the y values and the overall meanを計算します。

f:id:cross_hyou:20191009085903j:plain

SSYは68298です。

SSE、the error sum of squaresを計算します。最近の平均値、先行きの平均値はさきほど計算していますから、これを利用しましょう。

f:id:cross_hyou:20191009090653j:plain

SSEは65572です。

SSA、the treatment sum of squaresはSSY - SSEで計算できます。

f:id:cross_hyou:20191009090948j:plain

SSAは2726です。SSA, SSE, SSYがわかりましたので、ANOVA表を作ってみます。

f:id:cross_hyou:20191009091802j:plain

D3のセルのところ、SSEのMean Squareを計算します。

f:id:cross_hyou:20191009091956j:plain

 

f:id:cross_hyou:20191009092047j:plain

E2のところがF ratioです。これは、2726/166です。

f:id:cross_hyou:20191009094221j:plain

f:id:cross_hyou:20191009094233j:plain

これでANOVA表が完成しました。このF ratioの16.38が大きいのか小さいのか、qf関数で判定します。


f:id:cross_hyou:20191009094426j:plain

3.865よりも大きなF ratioだとSSAには意味があるということですから最近の平均と先行きの平均には有意な違いがありますね。

aov関数とsummary関数でも同じようにANOVA分析をします。

f:id:cross_hyou:20191009094811j:plain

p値が5.24e-05と0.05以下ですから、最近と先行きでは、有意な差があります。先行きのほうが悲観的なのですね。

今回は以上です。