Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

梅雨入り・梅雨明けデータでクロス表分析2 - 梅雨入り・梅雨明けの時期と降水量に関係はあるか?

f:id:cross_hyou:20180519121731j:plain

前回に引き続き、梅雨入り・梅雨明けデータを分析しようと思います。

今回のテーマは、梅雨入りの時期と降水量に関係はあるか?を調べたいと思います。

まずは、R言語のread.csv関数でデータを読み込みます。

データを読み取ったら、梅雨入りの時期と降水量の有無でクロス表を作ります。table関数で作れますね。

f:id:cross_hyou:20180607154040j:plain

summary関数でそれぞれの変数の度数を表示しました。

1951年から2017年までで、梅雨入りの時期が平年よりも早かったのが27回あり、降水量が平年よりも少なかったのが33回あることがわかります。

table関数でクロス表を作成します。

f:id:cross_hyou:20180607154348j:plain

なんとなく、梅雨入りの時期が早いと降水量が少なく、梅雨入りの時期が遅いと降水量が多いように見受けられます。

カイ二乗検定で独立性の検定をしましょう。帰無仮説は「梅雨入りの時期と降水量は関係がない」です。

まず、クロス表の3行目を削除して、2x2のクロス表に作成しなおしましょう。

入り降水量[-3, ]で3行目が削除されます。

f:id:cross_hyou:20180607154831j:plain

カイ2乗検定は、chisq.test関数です。

f:id:cross_hyou:20180607155123j:plain

p-value = 0.5363 > 0.005 ですから、帰無仮説を棄却できません。つまり、梅雨入りの時期と降水量は関係ないです。

続いて、梅雨明けの時期と降水量でも同様の分析をしてみましょう。

f:id:cross_hyou:20180607155535j:plain

どうでしょうか。。梅雨明けの時期が早いと降水量は少なく、遅いと多いように見えます。まず、「同じ」を除外して2x2のクロス表を作成して、カイ二乗検定をします。

帰無仮説は、「梅雨明けの時期と降水量は関係がない」です。

f:id:cross_hyou:20180607160035j:plain

p-value = 0.5078 > 0.005 なので帰無仮説を棄却できません。

つまり、梅雨明けの時期と降水量は関係がない、ということです。

今回の分析で、梅雨入り・梅雨明けの時期と降水量は関係がないことがわかりました。