今回は、青果物卸売市場調査のデータを使って、一番多くの種類の野菜を出荷した産地はどこなのか調べようと思います。
まずは、CSVファイルに保存してあるデータを、R言語に読込みます。read.csv関数を使います。そして、summary関数で要約統計量を表示します。
産地では、北海道、茨城、長野、千葉、青森が出現度数が多いですね。産地名を出現度数の多い順に並び替えましょう。table関数で出現度数のデータを作り、order関数を使い並び替えて表示します。
北海道はどのような野菜を作っているでしょうか?
subset関数で産地が北海道だけのデータフレームを作り、table関数とorder関数で品目の出現度数の多い順に表示してみましょう。
まずは、「野菜総量」「うち輸入」などの品目名で具体的な野菜名でないものを除外します。
北海道品目度数[北海道品目度数 > 0 ] とすることで度数が0の要素を削除し、それをlength関数で要素の数を数えています。北海道は32種類です。
茨城はどうでしょうか?
茨城は21品目ですね。
長野はどうでしょうか?
長野は19品目です。
千葉はどうでしょうか?
千葉は23品目ですね。
続いて青森です。
青森は17品目です。
群馬はどうでしょうか?
群馬は15品目です。
大分はどうでしょうか?
大分は11品目です。
福岡はどうでしょうか?
福岡は9品目です。
宮崎はどうでしょうか?
宮崎は14品目です。
熊本はどうでしょうか?
熊本は15品目です。
栃木はどうでしょうか?
栃木は11品目です。
まだまだ産地は残っていますが、疲れました。北海道の32品目を超える県はおそらくないでしょう。
もっと簡単に調べる関数があると思います。それがわかったらまたチャレンジして全部の都道府県について調べてみたいと思います。