今回から都道府県別の食料自給率のデータを分析してみようと思います。
データは、政府統計の総合窓口e-Statから取得しました。
47都道府県を選択して、
ダウンロードした項目は、総人口、昼夜間人口比率、総面積、年平均気温、課税対象所得、食料自給率です。
ダウンロードしてファイルはこんなのです。
R言語のread.csv関数でデータを読み込みます。
skip = 8, で8行をスキップして、9行目からデータを読み込みます。na.stringsで***, -, XはNAとして読み込みます。stringsAsFactors=FALSEにしているので、文字データはファクターにせずに文字のまま読み込みます。
na.omit関数でNAの行を削除します。
str関数でデータ構造を確認します。
94のobservationsとありますので、47 x 2 = 94 ですから、2年間分のデータです。
summary関数でサマリを表示します。
Yearは2つの年度のはずですから、as.factor関数でファクターにします。
class関数でファクターになったことを確認します。
食料自給率はどこが高いか、低いか確認します。tapply関数とmean関数で都道府県別の食料自給率の平均値を出し、sort関数で並び替えます。
神奈川県、大阪府、東京都は0.0で一番低いです。
北海道が19.5%で一番高く、秋田県が18.5%で2番、山形県が14.0%で3番です。
今回は以上です。