crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の建設総合統計のデータの分析1 - CSVのデータファイルをRに取り込む

Photo by Mikita Yo on Unsplash 

いつものように、政府統計の総合窓口(www.e-stat.go.jp)を閲覧すると、建設総合統計のデータベースが更新されているようでした。

建設総合統計は、国内の建設活動を出来高ベースで把握することを目的とした加工統計とのことです。

クリックすると、下の画像になりました。

一番下にある、年度次[9件]をクリックしてみます。

年度表 <<表-21>> 総合表 都道府県別・種類別-年度別工事費

というのをクリックしてみます。

このようなデータでした。これをダウンロードします。

このようなCSVファイルでした。

これを眺めて、少し整理整頓したのが下の画像です。

このCSVファイルをRに読み込んで、分析しようと思います。

まず、tidyverseパッケージの読み込みをしておきます。

read_csv()関数でCSVファイルを読み込みます。

minkou: 民間か公共か

shurui: 建設の種類

の2つの変数のデータ型をファクター型に変換します。

summary()関数で読み込んだデータを確認してみます。

こんな感じです。yearを見るとデータは、2019年、2020年、2021年の3年間のようです。

各変数にNAが含まれているかどうか調べます。

na_countという名前のNAを数える関数を作って、apply()関数で各列について調べました。どうやらNAは無いようです。

今回は以上です。

次回は

 

www.crosshyou.info

です。