Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全産業活動指数・建設業活動指数・鉱工業生産指数・第3次産業活動指数の分析1 - 基本統計量

今回は全産業活動指数の分析をしようと思います。

f:id:cross_hyou:20190720123756j:plain

政府統計の総合窓口(e-Stat)のウェブサイトからデータを取得しました。

今回は、

政府統計名:全産業活動指数

提供統計名:全産業活動指数(IAA)

提供分類1:長期時系列データ

提供分類2:平成22年(2010年)基準

提供分類3:時系列データ(平成20年01月~最新)

のデータの

表番号:全産業活動指数(IAA)

統計表:季節調整済指数の月次のファイルをダウンロードしました。

 

f:id:cross_hyou:20190720124248j:plain

こういうファイルです。横長のファイルですね。2行目にCol1, Col2と付け足しました。

まず、このファイルをread.csv関数でR言語に読込ませます。

f:id:cross_hyou:20190720125354j:plain


読込んだファイルは、観測数18 x 変数140 のファイルでした。

なので、本当は変数18、観測数140のデータですね。

読込んだデータフレームの左上の部分を見てみましょう。

f:id:cross_hyou:20190720130023j:plain

 

2列目、Col2の値が本当の変数名ですね。

f:id:cross_hyou:20190720130517j:plain

全産業活動指数から<参考系列>全産業活動指数(直接調整法)までの17種類ですね。

今回はこの中から、

全産業活動指数・建設業活動指数・鉱工業生産指数・第3次産業活動指数の4つのデータに注目してみます。

f:id:cross_hyou:20190720132252j:plain

とりあえず、月、全産業活動指数、建設業活動指数、鉱工業生産指数、第3次産業活動指数の4つのデータをそれぞれ、独立したベクトルとして抽出しました。

1行目のコマンドで、それぞれのデータを抽出し、それをas.matrix関数でデータフレーム型からマトリックス型に変換し、as.vector関数でマトリックス型からベクトル型に変換しました。str関数でデータ構造を確認しています。すべて137個の要素のある数値型のベクトルになりました。

f:id:cross_hyou:20190720133507j:plain

summary関数で月の基本統計量を算出しました、最小値は200801、最大値は201905なので、2008年01月から2019年05月までのデータですね。

sd関数で標準偏差を算出し、標準偏差をmean関数で算出する平均値で割って変動係数を算出しています。

他の指数も同じようにやってみます。

f:id:cross_hyou:20190720133805j:plain

最小値に着目すると、鉱工業生産指数の76.60が一番低く、

最大値に着目すると、建設業活動指数の118.7が一番高く、

変動係数に着目すると、第3次産業活動指数の0.022が一番低く、鉱工業生産指数の0.066が一番高く、

中央値に着目すると、鉱工業生産指数の99.20が一番低く、建設業活動指数の107.8が一番高く、

平均値に着目すると、鉱工業生産指数の99.16が一番低く、建設業活動指数の106.4が一番高いことがわかります。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。