crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

国立科学博物館の標本データベースの日本の鳥類の標本の分析3 - Mokuのデータが怪しいことに気が付いた。

 

www.crosshyou.info

 の続きです。

 今回は、Moku(目), Zoku(属), Shu(種)について調べます。

まず、Mokuは何種類あるか、標本数の多いMokuは何か調べてみましょう。

levels関数とlevels関数でMokuの種類数を調べます。

f:id:cross_hyou:20191130102933p:plain

Mokuは214種類ですね。どのMokuが一番多いか、summary関数で見てみます。

f:id:cross_hyou:20191130105016p:plain

sort関数で小さい順に並び替え、rev関数で大きい順にして、head関数で上位6を表示しています。PasseriformesというMokuが一番多いです。

Zokuも同じように調べます。まずは、何種類のZokuがあるでしょうか?

f:id:cross_hyou:20191130103459p:plain

232種類です。

どの属が一番多いでしょうか?

f:id:cross_hyou:20191130105252p:plain

EmberizaというZokuが一番多くて、557個ありました。

同じように、Shu(種)を調べましょう。

f:id:cross_hyou:20191130105404p:plain

Shuの数は382種類、japonicusというのが212で一番多いです。おそらくこれがメジロなのでしょう。確認します。

f:id:cross_hyou:20191130104411p:plain

idx <- df$Shu == "japonics"という行で論理ベクトルをつくり、これでdfの中からShuがjapinicusのだけを検索しています。head関数で始めの6行だけ表示しています。やっぱりメジロですね。メジロのMoku,ZokuはZosteroposというので、Mokuの一番多いPasseriformesでは無いのですね。

二番目に多いShuのamaurotisは何という鳥でしょうか?

f:id:cross_hyou:20191130110314p:plain

amaurotisはヒヨドリのことでしたね。ヒヨドリもMokuは一番多いPasseriformesではないですね。

それでは、Passeriformesにはどんな鳥がいるか見てみましょう。

f:id:cross_hyou:20191130111030p:plain

あれ?メジロ、ヒヨドリが入っています。おかしいですね。。

もとのCSVファイルをもう一度みてみましょう。

f:id:cross_hyou:20191130111904p:plain

こんなふうにメジロでもZosteriposになっているのもあれば、Passerifermosになっているのもありました。なんでですかね。。。Mokuはちょっと信用できないってことですね。Zokuはどうでしょうか?一番数の多かったEmberizaを見てみます。

f:id:cross_hyou:20191130112513p:plain

Emberizaに属するのはアオジ、ホオジロ、カシラダカなどとわかりました。

今回は以上です。