www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の世帯土地統計のデータの分析1 - Rのread_csv()関数でCSVファイルを読み込み、inner_join()関数でデータフレームを統合する。

UnsplashJasmin Maagが撮影した写真 

今回は、都道府県別の世帯土地統計のデータを分析してみようと思います。

政府統計の総合窓口(www.e-stat.go.jp)からデータを取得します。

たくさんデータセットがありましたが、今回は一番上の「世帯人員、土地の所有状況別世帯数」というデータをダウンロードしてみます。

データをダウンロードして、Rにインポートしやすいように少し加工しました。

このCSVファイルをRに読み込んでいきます。

まず、tidyverseパッケージを読み込みます。

read_csv()関数でデータを読み込みます。

glimpse()関数で読み込んだデータを見てみます。

問題なく読み込みできたようです。

このデータは2013年という1年だけのデータですので、year_codeとyearは必要ないので、削除します。select()関数を使います。

都道府県別の県民所得のデータも政府統計の総合窓口からダウンロードしました。

このCSVファイルもread_csv()関数でインポートします。

inner_join()関数で、dfとshotokuを統合します。

うまく結合できました。

変数名の確認をします。

pref_code: 数値型で都道府県のコードです。1000が北海道で4700が沖縄です。北にある県ほど値が小さいです。

pref: 文字列型で都道府県名です。

setai_code: 数値型で、100が総数、110, 120, 130となっていくに従い、世帯人数は1人、2人、3人となっていきます。

setai: 文字列型で世帯の人数です。総数、1人~4人、5人以上の6種類です。

total: 数値型で、土地の所有世帯数の総数です。2355000だと、235万5000世帯ということですね。

shoyu: 数値型で、現住居の敷地_現住居の敷地を所有している世帯の数です。

noshoyu: 数値型で、現住居の敷地_現住居の敷地を所有していない世帯の数です。

hokashoyu: 数値型で、現住居の敷地以外の土地_現住居の敷地以外の土地を所有している世帯の数です。

bothshoyu: 数値型で、現住居の敷地と現住居の敷地以外の土地の両方を所有している世帯の数です。

shotoku: 数値型で一人当たりの県民所得(平成23年基準)です。単位は千円です。2465だと246万5千円です。

今回は以上です。

次回は

www.crosshyou.info

です。