昨日(06月06日)、関東甲信・東海・近畿地方が梅雨入りしたと、気象庁から発表がありました。
そこで今回は、梅雨入り・梅雨明けのデータを使ってクロス表分析の練習をしてみたいと思います。
気象庁のホームページ(www.data.jma.go.jp/fcd/yoho/baiu/kako_baiu09.html)にこんな表がありました。
これを加工して、エクセルでこんなデータベースを作りました。
「年」がIDで、「年代」、「入りの時期」、「明けの時期」、「雨量」がカテゴリカルデータですね。早い、遅い、多い、少ないは、平年と比較して早いか遅いか、多いか少ないか、ということです。
このcsvファイルをR言語に読み込ませでクロス表を作成して、分析してみましょう。
read.csv関数で読み込みます。
head関数で始めの6行を表示しています。
summary関数でそれぞれのデータの度数を表示します。
明けの時期にNAが一つあります。これは、1993年でこの年は梅雨明けがはっきりしてなかったようです。
それではまず、梅雨入りの時期と梅雨明けの時期のクロス表を作成しましょう。
どうでしょうか?梅雨入りが早ければ梅雨明けも早い、梅雨入りが遅ければ梅雨明けも遅い、というような関係はないように見えます。「同じ」というのを削除して、単純な2X2のクロス表にしてみましょう。matrix関数で作成します。
このマトリックスでカイ二乗検定をします。chisq.test関数を使います。
p-value = 0.7993 > 0.005 ですから、帰無仮説:「梅雨入りの時期と梅雨明けの時期は関係がない」を棄却できません。ということで、梅雨入りが早いからと言って梅雨明けが早いとは限らない、ということがわかりました。