www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

国立科学博物館の標本データベースの日本の鳥類の標本の分析5 - ウグイスとスズメを比べると、スズメは北海道が多い。1~3月はスズメが多く、10~12月はウグイスが多い。

 

www.crosshyou.info

 の続きです。

今回はウグイスとスズメについて調べてみます。

まずは、ウグイス、スズメだけの作業用のデータフレームを作成します。

f:id:cross_hyou:20191209074822p:plain

ウグイスは124、スズメは121の標本があります。

それでは、都道府県別の標本数を見てみます。table関数を使います。

f:id:cross_hyou:20191209075202p:plain

う~ん、どうなんでしょうか。。正直この表を眺めてもよくわからないですね。

barplot関数を使って棒グラフを描きます。

f:id:cross_hyou:20191209080330p:plain

f:id:cross_hyou:20191209080341p:plain

どうでしょうか?

都道府県の数が多いのでもう少し集約しましょう。

f:id:cross_hyou:20191209082246p:plain

これでもう一度、都道府県別に集約してみます。

f:id:cross_hyou:20191209082503p:plain

これだと、ウグイスは鹿児島が多く、スズメは北海道が多いとわかりますね。

カイ二乗検定をしてみます。chisq.test関数です。

f:id:cross_hyou:20191209082644p:plain

p値が0.005635ですから、ウグイスとスズメでは違いがあるということですね。

上の表のどの箇所が有意に違うのか見てみます。

f:id:cross_hyou:20191209082924p:plain

調整済み残差を見てみます。kaiというカイ二乗検定の結果の中に、stdresという名前で格納されていますので、kai$stdresで呼び出せます。

f:id:cross_hyou:20191209083328p:plain

調整済み残差で見ると、絶対値で2以上のところが統計的に有意な違いがあるところです。その他と北海道ですね。スズメはウグイスと比較すると、北海道で採集された標本が有意に多いということですね。

年別ではどうでしょうか?taable関数です。

f:id:cross_hyou:20191209083851p:plain

この表を見ただけではよくわからないですね。barplot関数を使って棒グラフにしてみます。

f:id:cross_hyou:20191209084137p:plain

f:id:cross_hyou:20191209084149p:plain

棒グラフにしてみました。スズメは1930年代、ウグイスは1970年か80年代に多いような気がします。年代で区切ってみましょう。

f:id:cross_hyou:20191209085045p:plain

round関数で引数を-1にすると一桁上の数で丸めてくれます。-4.9を引いてから一桁上で丸めれば10年ごとの年代別になります。すこしわかりやすくなりました。ウグイスはどの年代にも標本がありますが、スズメは1890年代、1940年代、1980年代は標本がありません。

月別にも集計してみます。

f:id:cross_hyou:20191209085706p:plain

これも一見しただけではよくわからないですね。棒グラフを描きます。

f:id:cross_hyou:20191209090043p:plain

f:id:cross_hyou:20191209090052p:plain

1、2、3月はスズメが多くて、10、11、12月はウグイスが多いようですね。

12か月を1~3、4~9、10~12の3つに分けて集計してみましょう。

f:id:cross_hyou:20191209090534p:plain

こうして3つのカテゴリーにしました。

f:id:cross_hyou:20191209090703p:plain

棒グラフにしてみます。

f:id:cross_hyou:20191209090832p:plain

f:id:cross_hyou:20191209090850p:plain

4月から9月は同じくらいの差で、1、2、3月はスズメ、10、11、12月はウグイスが多いとはっきりわかりますね。この差は有意な差なのか、カイ二乗検定をしてます。

f:id:cross_hyou:20191209091058p:plain

p値が0.0006716です。0.05よりも有意な差があるということですね。

今回は以上です。