日銀短観2019年12月調査のデータ分析３ - 現状と先行きに有意な違いはあるのか？先行きのほうが現状よりも有意に悪い。

www.crosshyou.info

の続きです。

今回は現状と先行きに統計的に有意な違いがあるのかどうかを調べます。

まずは、summary関数でデータフレームを確認しましょう。

f:id:cross_hyou:20191218190456p:plain

今回もMichael J. CrawleyのStatistics An Introduction Using R Second Edition

Statistics: An Introduction Using R (English Edition)

作者:Michael J. Crawley
出版社/メーカー: Wiley
発売日: 2014/09/23
メディア: Kindle版

を参考にします。Chapter 6 Two Samplesを主に参考にします。

データフレームのNowが現状で、Nextが先行きです。

Nowの平均値は、6.119です。Nextの平均値は、2.226です。この違いは統計的に有意な違いなのでしょうか？

まず、NowとNextのvarianceが同じと言えるかどうかを見てみます。

f:id:cross_hyou:20191218191002p:plain

var関数でvarianceがわかります。

Nowのvarianceは、255.4314です。Nextのvarianceは212.5386です。

このvarianceの比、255.4314 / 212.5386をF_ratioという変数名で保存します。

f:id:cross_hyou:20191218191454p:plain

F_ratioは、1.201812です。var関数を使っても手計算でも同じ値です。

このF_ratioが大きい値だとNowとNextのvarianceが違うとわかります。

NowとNextのデータ個数は何個でしょうか？length関数で数えましょう。

f:id:cross_hyou:20191218191825p:plain

84個ですね。ということは、自由度は、84 - 1 = 83です。

F_ratioの分母も分子も自由度は83です。α = 0.05, 自由度83, 83のときのthe critical value of Fを求めます。qf関数です。

f:id:cross_hyou:20191218193508p:plain

the critical value of Fは1.542242です。F_ratioは1.201812とこれよりも小さいので、NowとNextのvarianceに違いがるとは言えないです。

var.test関数でこれが簡単にできます。

f:id:cross_hyou:20191218193759p:plain

p-value=0.4041と0.05よりも大きいです。つまり帰無仮説:二つのvarianceのratioは1である、を棄却できません。つまり、統計的に有意な違いは無いということです。

では、NowとNextの平均値に有意な違いがあるかどうか、t.test関数でt検定をします。

このケースでは、IndustryがNowとNextを両方回答していますから、対になったサンプルですね。なのでt.test関数にpaired = TRUEを加えます。

f:id:cross_hyou:20191218194347p:plain

p-value=6.704e-07と0.05よりも小さいので、NowとNextの平均値には有意な違いがある、といことです。NowよりもNextのほうが平均値は小さかったですね。(Nowの平均値は、6.119です。Nextの平均値は、2.226です。)、つまり日本企業全体として現状よりも先行きが厳しいとみているのでしょうね。

wilcox.test関数でWilcoxon Rank-Sum Testを実行します。

f:id:cross_hyou:20191218195349p:plain