Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

国立科学博物館の標本データベースの日本の鳥類の標本の分析4 - メジロは東京、ヒヨドリは東北の標本が多く、2,3,4月はヒヨドリが多く、1973年はヒヨドリがとっても多かった。

 

www.crosshyou.info

 の続きです。

今回はメジロとヒヨドリでは、標本の年、月、都道府県に差があるか調べてみます。

まずは、メジロとヒヨドリだけの作業用のデータフレームを作ります。

f:id:cross_hyou:20191207125100p:plain

Nameには、アオアシシギなど不要のファクタ水準があるので、削除します。

f:id:cross_hyou:20191207125333p:plain

as.character関数で文字列にして、as.factorでファクタに戻しています。

では、まずは、都道府県を見てみましょう。

f:id:cross_hyou:20191207125640p:plain

愛知県とか愛媛県とかメジロもヒヨドリも0の都道府県が何個かありますね。整理しましょう。

f:id:cross_hyou:20191207130015p:plain

すこしすっきりしました。眺めると、ヒヨドリは岩手、宮城、秋田、青森など東北が多くて、メジロは東京が多いですね。

それぞれの東北で採取された標本数を調べます。

まずは、東北と東北以外というファクタを作成します。

f:id:cross_hyou:20191207131154p:plain

岩手県、宮城県、山形県、秋田県、青森県を東北にして、それ以外を東北以外にしました。これでクロス表を作ります。

f:id:cross_hyou:20191207131402p:plain

クロス表を作成したら、chisq.test関数でカイ二乗検定をします。

f:id:cross_hyou:20191207131539p:plain

p値が9.184e-05ですから東北か東北でないかはヒヨドリ、メジロの標本数に関係があります。ヒヨドリは東北で採取された標本が多いということですね。

同じ要領で東京ファクターを作成してみましょう。

f:id:cross_hyou:20191207132144p:plain

このように、東京以外と東京都にわけました。

それではやってみます。

f:id:cross_hyou:20191207132414p:plain

p値は0.01344で0.05よりも小さいので、メジロとヒヨドリでは東京か東京以外かという標本数に有意な違いがある、ということですね。

今度は年に違いがあるかどうかを調べます。

f:id:cross_hyou:20191207133221p:plain

どうでしょうか。。。これは年の数が多すぎてよくわからないですね。。

barplot関数でグラフにしてみます。

f:id:cross_hyou:20191207133432p:plain

f:id:cross_hyou:20191207133448p:plain

1973年、ヒヨドリは36羽も標本になっています。突出して多いですね。何かあったんでしょうか?

月別はどうでしょうか?

f:id:cross_hyou:20191207134107p:plain

なんとなくヒヨドリとメジロでは採集された月に違いがある感じがします。

barplot関数で視覚化します。

f:id:cross_hyou:20191207134507p:plain

f:id:cross_hyou:20191207134518p:plain

2、3、4月はヒヨドリが多いですが、それ以外の月はメジロが多いですね。

2、3、4月とそれ以外の月で二分してクロス表にしてみましょう。

f:id:cross_hyou:20191207135940p:plain

これでクロス表を作成してカイ二乗検定をします。

f:id:cross_hyou:20191207140259p:plain


p値が6.822e-06と0.05より小さいのこのクロス表には有意な偏りがあります。ヒヨドリはメジロと比べると2,3,4月に採集された数が有意に多いことがわかります。

今回は以上です。