www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費動向調査データの分析4 - R言語のoneway.test関数で一元配置分散分析をしてみる。

 

www.crosshyou.info

 の続きです。今回はR言語のoneway.test関数を使って一元配置分散分析をしてみようと思います。

消費者態度指数の平均値が年毎、月ごとに違いがあるかどうかを分析します。

まず、ggplot関数を使って、年毎、月ごとの消費者態度指数を視覚化してみます。

まずは、tidyverseパッケージを読み込みます。

f:id:cross_hyou:20190206144433j:plain

まずは、年毎の消費者態度指数を視覚化してみます。

f:id:cross_hyou:20190206145118j:plain

f:id:cross_hyou:20190206145138j:plain

年毎にバラツキがあるのがわかりますね。

同じように月ごとにも視覚化してみましょう。

f:id:cross_hyou:20190206145457j:plain

f:id:cross_hyou:20190206145508j:plain

年ほどではありませんが、6月や7月と比べると11月、12月は平均値は低いですよね。

 

それでは、年毎に平均値に違いがあるかどうか oneway.test関数で検定してみます。

f:id:cross_hyou:20190206145917j:plain

が~~ん! 「十分な観測値がありません」というエラーになってしまいました。。よく考えると、2019年が1月のデータしかないんですよね。。2004年も9か月しかデータないですからね。2004年と2019年を除いたデータでやってみます。

f:id:cross_hyou:20190206150736j:plain

df_sml <- df %>% 以降の3行でまず、df_smlという2004年と2019年を除いたデータフレームを作成しています。table関数で確かに2004年と2019年が除外されていることを確認しています。最後に oneway.test関数で一元配置分散分析をしています。p-value < 2.2e-16 と0.05よりも小さい値ですから、年毎の消費者態度指数の平均値は統計的に有意な違いがあるとわかりました。

 

次は月ごとに消費者態度指数に違いがあるかどうかを調べましょう。

f:id:cross_hyou:20190206151230j:plain

p-value = 0.9928 と0.05よりも大きいですから、月ごとの平均値は有意な差はないということです。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。