crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の1住宅当たり延べ面積のデータの分析1 - R言語のread_csv関数でデータを読み込む。

今回は都道府県別の1住宅当たり延べ面積(m2)のデータを分析しようと思います。

データは、政府統計の総合窓口、e-statのサイトから取得します。

www.e-stat.go.jp

f:id:cross_hyou:20210227203753p:plain

47の都道府県を選びます。

f:id:cross_hyou:20210227203820p:plain

1住宅当り延べ面積に関係ありそうなデータとして、人口密度、経済規模、1世帯当たりの人数が関係あるかな、と思いました。なので、その算出に必要なデータを選びました。

f:id:cross_hyou:20210227204037p:plain

こういうファイルです。

これをR言語に読み込んで分析しようと思います。

まずは、とりあえずtidyverseパッケージを読み込んでおきます。

f:id:cross_hyou:20210227204820p:plain

read_csv関数でCSVファイルを読み込みます。

f:id:cross_hyou:20210227205113p:plain

skip = 9で10行目から読み込むようにしています。

na = のところで***, -, X はNAとして読み込むようにしています。

locale = のところで、文字のエンコーディングがUTF-8だと指定しています。

str関数で読み込まれたデータを見てみましょう。

f:id:cross_hyou:20210227205409p:plain

問題なく読み込んだようです。

変数名を確認しておきます。

year: 調査年コード
yearID: 調査年
prefID: 地域コード
pref: 地域
pop: 総人口【人】
setai: 世帯数【世帯数】
area: 可住地面積【ha】
gdp17: 平成17年基準県内総生産額【百万円】
gdp23: 平成23年基準県内総生産額【百万円】
nobe: 1住宅当たり延べ面積【m2】

nobeが1住宅当たり延べ面積です。これが人口密度や県内総生産額や1世帯当たりの人数によって変わるのかどうかをこれから調べたいと思います。

今回は以上です。

 次回は、

 

www.crosshyou.info

 です。