Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の1人当りの県民所得と賃貸住宅の家賃のデータ分析1 - R言語のread_csv関数でCSVファイルデータを読み込む。

今回は47都道府県別の1人当りの県民所得と賃貸住宅の家賃のデータを調べてみます。

まず、政府統計の総合窓口e-Statのウェブサイト(www.e-stat.go.jp)からデータを取得しました。

f:id:cross_hyou:20201219090026p:plain

47度道府県を選択して、

f:id:cross_hyou:20201219091304p:plain



このように、1人当りの県民所得(平成23年基準)(千円)と賃貸住宅の家賃(1か月3.3m2当たり)(円)をデータで選択します。

ダウンロードしたCSVファイルはこのようなものでした。

f:id:cross_hyou:20201219093955p:plain

このようなものでした。

9行目に私が変数名を入れておきました。

year: 調査年

income: 1人当りの県民所得(平成23年基準、千円)

rent_ko: 公営賃貸住宅の家賃(1か月3.3m2当たり、円)

rent_mi: 民間賃貸住宅の家賃(1か月3.3m2当たり、円)です。

このCSVファイルをR言語で読み込みます。

tidyverseパッケージをまず読み込んでおきます。

f:id:cross_hyou:20201219092953p:plain

read_csv関数でデータを読み込みます。

f:id:cross_hyou:20201219094055p:plain

skip = 8 で頭の8行はとばして9行目から読み込みます。

na = のところで***, X, - はNAとして処理します。

locale = のところでエンコードがUTF-8だと指定しています。

上手く読み込まれているか、str関数で見てみます。

f:id:cross_hyou:20201219094154p:plain

大丈夫なようです。

もう一つ、CSVファイルを読み込みます。

f:id:cross_hyou:20201219094257p:plain

こういうデータです。都道府県の地域分類です。

region: 北海道東北、関東など

ew: 東日本と西日本

jpo: 日本海側と太平洋側とその他

これも読み込みます。

f:id:cross_hyou:20201219094743p:plain

こうして読み込んだraw_dataとpref_regionを結合します。

left_join関数でprefという変数名をキーにして結合します。

f:id:cross_hyou:20201219095345p:plain

na.omit関数でNAの行を削除しました。

423行のデータがあります。

今回は以上です。

次回は

 

www.crosshyou.info

 です。