crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

消費者態度指数の分析6 - 5月と12月では有意な差があるのか?

前回の分析では、消費者態度指数は、5月の平均値が一番高く、12月の平均値が一番低いことがわかりました。

しかし、5月の平均値は42.4733、12月の平均値は40.2000という違いでした。この違いは有意な差といえるのでしょうか?調べてみましょう。

まずは、csvファイルのデータをR言語にread.csv関数で読み込ませます。

f:id:cross_hyou:20180706123636j:plain

summary関数でデータのサマリーを表示しました。

次にsubset関数で5月だけのデータフレームを作成し、平均値をapply関数とmean関数を組み合わせて算出しました。

f:id:cross_hyou:20180706123706j:plain

同じように12月の平均値も算出します。

f:id:cross_hyou:20180706123850j:plain

それぞれの指数の値を確認しましょう。

f:id:cross_hyou:20180706123923j:plain

データの数は5月は15個、12月は14個と少ないので、平均値の検定ではなくて、中央値に差があるかの検定をします。

それぞれの中央値をmedian関数で算出します。

f:id:cross_hyou:20180706124428j:plain

5月の中央値は42.7で、12月の中央値は40.1です。

2つの中央値の検定は、ウィルコクソン=マン・ホイットニー検定です。関数は、wilcox.test関数です。

f:id:cross_hyou:20180706125036j:plain

p-value = 0.2517 > 0.05 なので帰無仮説「5月と12月の中央値は同じ」を棄却できませんでした。

つまり、5月の中央値と12月の中央値は異なっていると言い切ることはできませんでした。