crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の乳用牛のデータ分析1 - R言語でデータを読み込む。乾乳、飼養、あなたは読めますか?

政府統計の総合、e-stat(www.e-stat.go.jp)を閲覧してみたら、

畜産統計調査

畜産統計調査という統計が新着していました。

クリックしてみました。

畜産統計調査

乳用牛などの飼養数などのデータらしいです。

畜産統計調査

新着の「年次[1件]」をクリックしてみます。

畜産統計調査

EXCELをクリックします。

畜産統計調査

こういうファイルです。

このファイルから必要なデータだけを抜き出し、

乳用牛のデータ

というCSVファイルを作成しました。

これをR言語で分析しようと思います。

その前に乾乳牛ってなんでしょうか?Webで検索してみました。

乾乳とは

乾乳(かんにゅう)とは何? Weblio辞書

Weblio辞書によると、搾乳を中止して休んでいる状態の牛のようです。

それでは早速R言語のread.csv関数でデータを読み込みます。

read.csv関数

 

str関数でデータフレーム、dfの構造を確認します。

str関数

問題なくデータは読み込めたようです。

summary関数で各データの平均値や最小値、最大値を確認します。

summary関数

Firmは飼養(しよう)家数です。一番少ない都道府県で11, 一番多い都道府県で5840です。

平均値は305.6, 中央値は135です。

Adult_Sakuは2歳以上で搾乳中の牛の数です。一番少ない都道府県で440, 一番多い都道府県で39万1000です。平均値は1万5232、中央値は5020です。

Adult_Kanは2歳以上で乾乳中の牛の数です。一番少ない都道府県で70, 一番多い都道府県で6万9000です。平均値は2631, 中央値790です。

Adult_Notは2歳以上ですが、まだ子どもを産んだことがなくて、お乳が出ない牛の数です。一番少ない都道府県で10、一番多い都道府県で3万5500です。平均値は1300, 中央値は380です。

Childは2歳未満の子どもの牛です。一番少ない都道府県で40, 一番多い都道府県で32万5400です。

今回は以上です。