今回は全産業活動指数の分析をしようと思います。
政府統計の総合窓口(e-Stat)のウェブサイトからデータを取得しました。
今回は、
政府統計名:全産業活動指数
提供統計名:全産業活動指数(IAA)
提供分類1:長期時系列データ
提供分類2:平成22年(2010年)基準
提供分類3:時系列データ(平成20年01月~最新)
のデータの
表番号:全産業活動指数(IAA)
統計表:季節調整済指数の月次のファイルをダウンロードしました。
こういうファイルです。横長のファイルですね。2行目にCol1, Col2と付け足しました。
まず、このファイルをread.csv関数でR言語に読込ませます。
読込んだファイルは、観測数18 x 変数140 のファイルでした。
なので、本当は変数18、観測数140のデータですね。
読込んだデータフレームの左上の部分を見てみましょう。
2列目、Col2の値が本当の変数名ですね。
全産業活動指数から<参考系列>全産業活動指数(直接調整法)までの17種類ですね。
今回はこの中から、
全産業活動指数・建設業活動指数・鉱工業生産指数・第3次産業活動指数の4つのデータに注目してみます。
とりあえず、月、全産業活動指数、建設業活動指数、鉱工業生産指数、第3次産業活動指数の4つのデータをそれぞれ、独立したベクトルとして抽出しました。
1行目のコマンドで、それぞれのデータを抽出し、それをas.matrix関数でデータフレーム型からマトリックス型に変換し、as.vector関数でマトリックス型からベクトル型に変換しました。str関数でデータ構造を確認しています。すべて137個の要素のある数値型のベクトルになりました。
summary関数で月の基本統計量を算出しました、最小値は200801、最大値は201905なので、2008年01月から2019年05月までのデータですね。
sd関数で標準偏差を算出し、標準偏差をmean関数で算出する平均値で割って変動係数を算出しています。
他の指数も同じようにやってみます。
最小値に着目すると、鉱工業生産指数の76.60が一番低く、
最大値に着目すると、建設業活動指数の118.7が一番高く、
変動係数に着目すると、第3次産業活動指数の0.022が一番低く、鉱工業生産指数の0.066が一番高く、
中央値に着目すると、鉱工業生産指数の99.20が一番低く、建設業活動指数の107.8が一番高く、
平均値に着目すると、鉱工業生産指数の99.16が一番低く、建設業活動指数の106.4が一番高いことがわかります。
今回は以上です。
次回は
です。