今回は47都道府県別の1人当りの県民所得と賃貸住宅の家賃のデータを調べてみます。
まず、政府統計の総合窓口e-Statのウェブサイト(www.e-stat.go.jp)からデータを取得しました。
47度道府県を選択して、
このように、1人当りの県民所得(平成23年基準)(千円)と賃貸住宅の家賃(1か月3.3m2当たり)(円)をデータで選択します。
ダウンロードしたCSVファイルはこのようなものでした。
このようなものでした。
9行目に私が変数名を入れておきました。
year: 調査年
income: 1人当りの県民所得(平成23年基準、千円)
rent_ko: 公営賃貸住宅の家賃(1か月3.3m2当たり、円)
rent_mi: 民間賃貸住宅の家賃(1か月3.3m2当たり、円)です。
このCSVファイルをR言語で読み込みます。
tidyverseパッケージをまず読み込んでおきます。
read_csv関数でデータを読み込みます。
skip = 8 で頭の8行はとばして9行目から読み込みます。
na = のところで***, X, - はNAとして処理します。
locale = のところでエンコードがUTF-8だと指定しています。
上手く読み込まれているか、str関数で見てみます。
大丈夫なようです。
もう一つ、CSVファイルを読み込みます。
こういうデータです。都道府県の地域分類です。
region: 北海道東北、関東など
ew: 東日本と西日本
jpo: 日本海側と太平洋側とその他
これも読み込みます。
こうして読み込んだraw_dataとpref_regionを結合します。
left_join関数でprefという変数名をキーにして結合します。
na.omit関数でNAの行を削除しました。
423行のデータがあります。
今回は以上です。
次回は
です。