crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の食料自給率のデータ分析1 - R言語でデータを読み込む

今回から都道府県別の食料自給率のデータを分析してみようと思います。
データは、政府統計の総合窓口e-Statから取得しました。

www.e-stat.go.jp

f:id:cross_hyou:20200509151052j:plain

47都道府県を選択して、

f:id:cross_hyou:20200509151115j:plain

ダウンロードした項目は、総人口、昼夜間人口比率、総面積、年平均気温、課税対象所得、食料自給率です。

f:id:cross_hyou:20200509151224j:plain

ダウンロードしてファイルはこんなのです。

R言語のread.csv関数でデータを読み込みます。

f:id:cross_hyou:20200509152014j:plain

skip = 8, で8行をスキップして、9行目からデータを読み込みます。na.stringsで***, -, XはNAとして読み込みます。stringsAsFactors=FALSEにしているので、文字データはファクターにせずに文字のまま読み込みます。

na.omit関数でNAの行を削除します。

f:id:cross_hyou:20200509152259j:plain

str関数でデータ構造を確認します。

f:id:cross_hyou:20200509152439j:plain

94のobservationsとありますので、47 x 2 = 94 ですから、2年間分のデータです。

summary関数でサマリを表示します。

f:id:cross_hyou:20200509152648j:plain

Yearは2つの年度のはずですから、as.factor関数でファクターにします。

f:id:cross_hyou:20200509152826j:plain

class関数でファクターになったことを確認します。

f:id:cross_hyou:20200509152951j:plain

食料自給率はどこが高いか、低いか確認します。tapply関数とmean関数で都道府県別の食料自給率の平均値を出し、sort関数で並び替えます。

f:id:cross_hyou:20200509153303j:plain

神奈川県、大阪府、東京都は0.0で一番低いです。

北海道が19.5%で一番高く、秋田県が18.5%で2番、山形県が14.0%で3番です。

今回は以上です。