政府統計の総合、e-stat(www.e-stat.go.jp)を閲覧してみたら、
畜産統計調査という統計が新着していました。
クリックしてみました。
乳用牛などの飼養数などのデータらしいです。
新着の「年次[1件]」をクリックしてみます。
EXCELをクリックします。
こういうファイルです。
このファイルから必要なデータだけを抜き出し、
というCSVファイルを作成しました。
これをR言語で分析しようと思います。
その前に乾乳牛ってなんでしょうか?Webで検索してみました。
Weblio辞書によると、搾乳を中止して休んでいる状態の牛のようです。
それでは早速R言語のread.csv関数でデータを読み込みます。
str関数でデータフレーム、dfの構造を確認します。
問題なくデータは読み込めたようです。
summary関数で各データの平均値や最小値、最大値を確認します。
Firmは飼養(しよう)家数です。一番少ない都道府県で11, 一番多い都道府県で5840です。
平均値は305.6, 中央値は135です。
Adult_Sakuは2歳以上で搾乳中の牛の数です。一番少ない都道府県で440, 一番多い都道府県で39万1000です。平均値は1万5232、中央値は5020です。
Adult_Kanは2歳以上で乾乳中の牛の数です。一番少ない都道府県で70, 一番多い都道府県で6万9000です。平均値は2631, 中央値790です。
Adult_Notは2歳以上ですが、まだ子どもを産んだことがなくて、お乳が出ない牛の数です。一番少ない都道府県で10、一番多い都道府県で3万5500です。平均値は1300, 中央値は380です。
Childは2歳未満の子どもの牛です。一番少ない都道府県で40, 一番多い都道府県で32万5400です。
今回は以上です。