Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

貴金属流通統計調査の分析4 - 金需要の平成29年と平成30年で違いがあるか?(t.test関数、wilcox.test関数、binom.test関数)

今回は、金の需要が平成29年と平成30年で増加、もしくは減少しているのかを調べたいと思います。

まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。

f:id:cross_hyou:20180919203803j:plain

平成29年は1月から10月まで、平成30年は1月から7月までのデータがありました。季節によって金需要に差があるかもしれませんので、平成29年も平成30年も1月から7月までのデータで比較しましょう。

とりあえず、一番数量の多い電機機械のデータで調べてみましょう。

まずは、それぞれのベクトルを作成します。

f:id:cross_hyou:20180919204237j:plain

f:id:cross_hyou:20180919204248j:plain

こうして2つのベクトルが作成できました。

まずは2つの合計値を確認して、どっちが多いか少ないかを見ます。

f:id:cross_hyou:20180919204455j:plain

平成29年よりも平成30年のほうが多いですね。

まずは、平均値で検定します。ほんとうは2つのデータとも7個しかデータないので平均値は検定できないんじゃないかと思いますが、R言語の練習なのでかまわずやります。t検定のt.test関数です。

f:id:cross_hyou:20180919204911j:plain

p-value = 0.02067 < 0.05 なので有意です。つまり平成29年と平成30年では違いがある、ということですね。

次は、2つのデータの中央値(分布の位置)に違いがあるかを検定します。ウィルコクソン=マン・ホイットニー検定のwilcox.test関数です。

f:id:cross_hyou:20180919205349j:plain

p-value = 0.03125 < 0.05 なので有意です。つまり、平成29年と平成30年ではデータの分布に違いがあるということです。

最後に符号検定をしてみましょう。平成29年と平成30年を比較して、増加しているのか減少しているのかを調べます。

f:id:cross_hyou:20180919205619j:plain

平成30年のほうが多い月が6か月あって、平成29年のほうが多い月が1月ありました。

これで二項検定のbinom.test関数を使います。

f:id:cross_hyou:20180919205904j:plain

p-value = 0.125 > 0.05 なので有意とは言えないです。つまり平成30年のほうが平成29年よりも多いとは言い切れない、ということです。

平均値と標本の位置では違いがある、二項検定では違いが無いという結果になりました。