の続きです。
今回はメジロとヒヨドリでは、標本の年、月、都道府県に差があるか調べてみます。
まずは、メジロとヒヨドリだけの作業用のデータフレームを作ります。
Nameには、アオアシシギなど不要のファクタ水準があるので、削除します。
as.character関数で文字列にして、as.factorでファクタに戻しています。
では、まずは、都道府県を見てみましょう。
愛知県とか愛媛県とかメジロもヒヨドリも0の都道府県が何個かありますね。整理しましょう。
すこしすっきりしました。眺めると、ヒヨドリは岩手、宮城、秋田、青森など東北が多くて、メジロは東京が多いですね。
それぞれの東北で採取された標本数を調べます。
まずは、東北と東北以外というファクタを作成します。
岩手県、宮城県、山形県、秋田県、青森県を東北にして、それ以外を東北以外にしました。これでクロス表を作ります。
クロス表を作成したら、chisq.test関数でカイ二乗検定をします。
p値が9.184e-05ですから東北か東北でないかはヒヨドリ、メジロの標本数に関係があります。ヒヨドリは東北で採取された標本が多いということですね。
同じ要領で東京ファクターを作成してみましょう。
このように、東京以外と東京都にわけました。
それではやってみます。
p値は0.01344で0.05よりも小さいので、メジロとヒヨドリでは東京か東京以外かという標本数に有意な違いがある、ということですね。
今度は年に違いがあるかどうかを調べます。
どうでしょうか。。。これは年の数が多すぎてよくわからないですね。。
barplot関数でグラフにしてみます。
1973年、ヒヨドリは36羽も標本になっています。突出して多いですね。何かあったんでしょうか?
月別はどうでしょうか?
なんとなくヒヨドリとメジロでは採集された月に違いがある感じがします。
barplot関数で視覚化します。
2、3、4月はヒヨドリが多いですが、それ以外の月はメジロが多いですね。
2、3、4月とそれ以外の月で二分してクロス表にしてみましょう。
これでクロス表を作成してカイ二乗検定をします。
p値が6.822e-06と0.05より小さいのこのクロス表には有意な偏りがあります。ヒヨドリはメジロと比べると2,3,4月に採集された数が有意に多いことがわかります。
今回は以上です。