前回に引き続き、梅雨入り・梅雨明けデータを分析しようと思います。
今回のテーマは、梅雨入りの時期と降水量に関係はあるか?を調べたいと思います。
まずは、R言語のread.csv関数でデータを読み込みます。
データを読み取ったら、梅雨入りの時期と降水量の有無でクロス表を作ります。table関数で作れますね。
summary関数でそれぞれの変数の度数を表示しました。
1951年から2017年までで、梅雨入りの時期が平年よりも早かったのが27回あり、降水量が平年よりも少なかったのが33回あることがわかります。
table関数でクロス表を作成します。
なんとなく、梅雨入りの時期が早いと降水量が少なく、梅雨入りの時期が遅いと降水量が多いように見受けられます。
カイ二乗検定で独立性の検定をしましょう。帰無仮説は「梅雨入りの時期と降水量は関係がない」です。
まず、クロス表の3行目を削除して、2x2のクロス表に作成しなおしましょう。
入り降水量[-3, ]で3行目が削除されます。
カイ2乗検定は、chisq.test関数です。
p-value = 0.5363 > 0.005 ですから、帰無仮説を棄却できません。つまり、梅雨入りの時期と降水量は関係ないです。
続いて、梅雨明けの時期と降水量でも同様の分析をしてみましょう。
どうでしょうか。。梅雨明けの時期が早いと降水量は少なく、遅いと多いように見えます。まず、「同じ」を除外して2x2のクロス表を作成して、カイ二乗検定をします。
帰無仮説は、「梅雨明けの時期と降水量は関係がない」です。
p-value = 0.5078 > 0.005 なので帰無仮説を棄却できません。
つまり、梅雨明けの時期と降水量は関係がない、ということです。
今回の分析で、梅雨入り・梅雨明けの時期と降水量は関係がないことがわかりました。