今回は、金の需要が平成29年と平成30年で増加、もしくは減少しているのかを調べたいと思います。
まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。
平成29年は1月から10月まで、平成30年は1月から7月までのデータがありました。季節によって金需要に差があるかもしれませんので、平成29年も平成30年も1月から7月までのデータで比較しましょう。
とりあえず、一番数量の多い電機機械のデータで調べてみましょう。
まずは、それぞれのベクトルを作成します。
こうして2つのベクトルが作成できました。
まずは2つの合計値を確認して、どっちが多いか少ないかを見ます。
平成29年よりも平成30年のほうが多いですね。
まずは、平均値で検定します。ほんとうは2つのデータとも7個しかデータないので平均値は検定できないんじゃないかと思いますが、R言語の練習なのでかまわずやります。t検定のt.test関数です。
p-value = 0.02067 < 0.05 なので有意です。つまり平成29年と平成30年では違いがある、ということですね。
次は、2つのデータの中央値(分布の位置)に違いがあるかを検定します。ウィルコクソン=マン・ホイットニー検定のwilcox.test関数です。
p-value = 0.03125 < 0.05 なので有意です。つまり、平成29年と平成30年ではデータの分布に違いがあるということです。
最後に符号検定をしてみましょう。平成29年と平成30年を比較して、増加しているのか減少しているのかを調べます。
平成30年のほうが多い月が6か月あって、平成29年のほうが多い月が1月ありました。
これで二項検定のbinom.test関数を使います。
p-value = 0.125 > 0.05 なので有意とは言えないです。つまり平成30年のほうが平成29年よりも多いとは言い切れない、ということです。
平均値と標本の位置では違いがある、二項検定では違いが無いという結果になりました。