Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気ウォッチャー調査データと株価の分析1 - R言語で基本統計量を計算する。hist関数とplot関数も使ってみる。

今回は景気ウォッチャー調査の分析をしてみようと思います。これに加えて株価のデータも一緒に分析しましょう。

e-Stat 政府統計の総合窓口からデータを取得しました。

f:id:cross_hyou:20190208150508j:plain

この2番目の「分野・業種別DI」というファイルのデータを分析します。

f:id:cross_hyou:20190208150851j:plain

このファイルのデータと

f:id:cross_hyou:20190208150911j:plain

このファイルのデータを分析しようと思います。
株価のデータは、内閣府の景気動向指数のファイル

f:id:cross_hyou:20190208152725j:plain

この個別系列の数値の「先行系列(Excel形式:118KB)」のファイルから取得しました。

f:id:cross_hyou:20190208152928j:plain

まず、これらのデータをまとめたCSVファイルを作成しました。

f:id:cross_hyou:20190208153345j:plain

このCSVファイルをread.csv関数で読込み、summary関数で基本統計量を算出します。

f:id:cross_hyou:20190208153907j:plain

read.csv関数でR言語にデータを読込み、str関数で構造を調べます。

219の観測があって変数は47個あります。

summary関数で最小値、第1分位、中央値、平均値、第3分位、最大値を表示します。

f:id:cross_hyou:20190208154200j:plain

f:id:cross_hyou:20190208154220j:plain

変数の数が多いので大変ですね。よくわからないです。

とりあえず、合計現状、合計先行き、株価の基本統計量やヒストグラム、推移はみておきましょう。

基本統計量と変動係数は

f:id:cross_hyou:20190208154756j:plain

となりました。先行きのほうが現状よりも平均値が高いですね。楽観的ということでしょうか?変動係数は株価が一番高いです。株価は変動が大きいですね。

ヒストグラムはどうでしょうか?hist関数です。

f:id:cross_hyou:20190208155252j:plain

f:id:cross_hyou:20190208155305j:plain

合計現状(赤)と合計先行き(青)は左の裾が広い山型の分布ですが、株価(緑)の分布の形状はあきらかに別物ですね。

推移を見てみましょう。plot関数です。

f:id:cross_hyou:20190208155858j:plain

これも合計現状(赤)と合計先行き(青)は同じような推移ですが、株価(緑)は違う動きですね。

今回は以上です。

次回は

 

www.crosshyou.info

 

です。