今回は都道府県別の1住宅当たり延べ面積(m2)のデータを分析しようと思います。
データは、政府統計の総合窓口、e-statのサイトから取得します。
www.e-stat.go.jp
47の都道府県を選びます。
1住宅当り延べ面積に関係ありそうなデータとして、人口密度、経済規模、1世帯当たりの人数が関係あるかな、と思いました。なので、その算出に必要なデータを選びました。
こういうファイルです。
これをR言語に読み込んで分析しようと思います。
まずは、とりあえずtidyverseパッケージを読み込んでおきます。
read_csv関数でCSVファイルを読み込みます。
skip = 9で10行目から読み込むようにしています。
na = のところで***, -, X はNAとして読み込むようにしています。
locale = のところで、文字のエンコーディングがUTF-8だと指定しています。
str関数で読み込まれたデータを見てみましょう。
問題なく読み込んだようです。
変数名を確認しておきます。
year: 調査年コード
yearID: 調査年
prefID: 地域コード
pref: 地域
pop: 総人口【人】
setai: 世帯数【世帯数】
area: 可住地面積【ha】
gdp17: 平成17年基準県内総生産額【百万円】
gdp23: 平成23年基準県内総生産額【百万円】
nobe: 1住宅当たり延べ面積【m2】
nobeが1住宅当たり延べ面積です。これが人口密度や県内総生産額や1世帯当たりの人数によって変わるのかどうかをこれから調べたいと思います。
今回は以上です。
次回は、
です。