Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

建設総合統計のデータ分析1 - R言語で基本統計量と変動係数(CV)を算出。民間土木が一番変動が少なく、民間非居住用が一番変動が大きい。

いつものように、e-stat 政府統計の総合窓口(www.e-stat.go.jp)を閲覧していたら、建設総合統計というデータが新着でありました。

f:id:cross_hyou:20200219154726p:plain

今回はこのデータを分析してみましょう。

f:id:cross_hyou:20200219155014p:plain

建設総合統計じゃ、国内の建設活動を出来高ベースで把握することを目的として加工統計です。とのことです。

f:id:cross_hyou:20200219155215p:plain

この年次のファイルをダウンロードしてみます。

f:id:cross_hyou:20200219155507p:plain

こういうファイルでした。このファイルを少し加工しました。

f:id:cross_hyou:20200219160948p:plain

このようにしました。

これをread.csv関数でR言語に読込み、str関数でデータの数や型を確認します。

f:id:cross_hyou:20200219161824p:plain

36年分のデータがあるようです。民間部門のデータと公共部門のデータに大きく分かれます。すべての変数が数値型です。

各変数の説明です。

# 変数の説明
# 単位:億円

# 総計 Total
# 民間 Minkan
# 建築 MinKen
# 居住用 MinHou
# 非居住用 MinNon
# 土木 MinDob
# 公共 Kokyo
# 建築 KoKen
# 居住用 KoHou
# 非居住用 KoNon
# 土木 KoDob
# 民間非住宅建築+民間土木 MinNonDob
# 西暦 Year

まずはsummary関数で各変数の平均値などを確認します。

f:id:cross_hyou:20200219162134p:plain

Total(総計)を見ると最小値は41兆7865億円、最大値は86兆3860億円、中央値は55兆0008億円、平均値は60兆3485億円です。

Minkan(民間)は最小値は25兆8321億円、最大値は58兆7950億円、中央値は33兆2470億円、平均値は、36兆4822憶円です。

Kokyo(公共)は最小値は15兆6950憶円、最大値は34兆6219億円、中央値は22兆2255億円、平均値は23兆8663億円です。

民間のほうが公共よりも金額は大きいのですね。

Total(総計)の推移をplot関数でグラフにしてみます。

f:id:cross_hyou:20200219164707p:plain

f:id:cross_hyou:20200219164722p:plain

lines関数で点と点を結ぶ線を引きました。上がって下がって上がる、という推移です。

 

各変数の変動係数(CV)を計算してみましょう。変動係数は、標準偏差 / 平均値 で計算します。値が大きいほど変動の度合いが大きいということですね。

f:id:cross_hyou:20200219165024p:plain

apply関数とsd関数で各変数の標準偏差を、apply関数とmean関数で各変数の平均値を計算して、変動係数を算出しました。算出した変動係数をsort関数で小さい順に並べて表示しました。Yearは除くと、一番変動が小さいのがMnDob(民間土木)です。民間の土木ってどんなのでしょうか?イメージがわかないです。一番変動が大きいのはMinNon(民間非居住用)です。民間の非居住用ということは、商業施設や工場やオフィスビルでしょうね。これらは景気変動にもろに影響するでしょうから変動は大きいでしょう。

今回は以上です。