Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

梅雨入り・梅雨明けデータでクロス表分析1 - 梅雨入りが早ければ梅雨明けも早いか?

f:id:cross_hyou:20180519121731j:plain

昨日(06月06日)、関東甲信・東海・近畿地方が梅雨入りしたと、気象庁から発表がありました。

そこで今回は、梅雨入り・梅雨明けのデータを使ってクロス表分析の練習をしてみたいと思います。

気象庁のホームページ(www.data.jma.go.jp/fcd/yoho/baiu/kako_baiu09.html)にこんな表がありました。

f:id:cross_hyou:20180607115552j:plain

これを加工して、エクセルでこんなデータベースを作りました。

f:id:cross_hyou:20180607120522j:plain

「年」がIDで、「年代」、「入りの時期」、「明けの時期」、「雨量」がカテゴリカルデータですね。早い、遅い、多い、少ないは、平年と比較して早いか遅いか、多いか少ないか、ということです。

このcsvファイルをR言語に読み込ませでクロス表を作成して、分析してみましょう。

read.csv関数で読み込みます。

f:id:cross_hyou:20180607121340j:plain

head関数で始めの6行を表示しています。

summary関数でそれぞれのデータの度数を表示します。

f:id:cross_hyou:20180607121629j:plain

明けの時期にNAが一つあります。これは、1993年でこの年は梅雨明けがはっきりしてなかったようです。

それではまず、梅雨入りの時期と梅雨明けの時期のクロス表を作成しましょう。

f:id:cross_hyou:20180607122109j:plain

どうでしょうか?梅雨入りが早ければ梅雨明けも早い、梅雨入りが遅ければ梅雨明けも遅い、というような関係はないように見えます。「同じ」というのを削除して、単純な2X2のクロス表にしてみましょう。matrix関数で作成します。

f:id:cross_hyou:20180607123019j:plain

このマトリックスカイ二乗検定をします。chisq.test関数を使います。

f:id:cross_hyou:20180607123229j:plain

p-value = 0.7993 > 0.005 ですから、帰無仮説:「梅雨入りの時期と梅雨明けの時期は関係がない」を棄却できません。ということで、梅雨入りが早いからと言って梅雨明けが早いとは限らない、ということがわかりました。