Photo by Mikita Yo on Unsplash
いつものように、政府統計の総合窓口(www.e-stat.go.jp)を閲覧すると、建設総合統計のデータベースが更新されているようでした。
建設総合統計は、国内の建設活動を出来高ベースで把握することを目的とした加工統計とのことです。
クリックすると、下の画像になりました。
一番下にある、年度次[9件]をクリックしてみます。
年度表 <<表-21>> 総合表 都道府県別・種類別-年度別工事費
というのをクリックしてみます。
このようなデータでした。これをダウンロードします。
このようなCSVファイルでした。
これを眺めて、少し整理整頓したのが下の画像です。
このCSVファイルをRに読み込んで、分析しようと思います。
まず、tidyverseパッケージの読み込みをしておきます。
read_csv()関数でCSVファイルを読み込みます。
minkou: 民間か公共か
shurui: 建設の種類
の2つの変数のデータ型をファクター型に変換します。
summary()関数で読み込んだデータを確認してみます。
こんな感じです。yearを見るとデータは、2019年、2020年、2021年の3年間のようです。
各変数にNAが含まれているかどうか調べます。
na_countという名前のNAを数える関数を作って、apply()関数で各列について調べました。どうやらNAは無いようです。
今回は以上です。
次回は
です。