今回は先日発表発表された日銀短観2019年12月調査のデータを分析してみようと思います。
上の画像のZIPファイルの中にあるExcelファイルをダウンロードしました。
こういうファイルです。
これをR言語で分析しようと思います。
こんな感じでCSVファイルにしました。これをread.csv関数でR言語に読込みます。
head関数ではじめの6行だけ表示しました。
summary関数で基本的な統計値を確認しましょう。
Sector, Industry, Sizeがカテゴリカル変数で、Now, NowChg, Next, NextChgが数値変数ですね。短観は0より大きければ景気が良い、0よりも小さければ景気が悪いことを意味します。Nowは現状、Nextは先行きです。どちらの平均値も中央値も0よりも大きいですので、景気は良いのですね。NowChgが現状の変化幅(前回調査との比較)、NextChgが先行きの変化幅です。どちらの平均値、中央値もマイナスですから、前回の調査と比べると景況感は悪化している、ということですね。
数値変数については、分散、標準偏差、変動係数も調べてみましょう。
var関数で分散、sd関数で標準偏差、sd関数 / mean関数で変動係数です。
apply関数と組み合わせて4つの変数についていっぺんに計算しました。
変動係数を見ると、Next(先行き)が一番変動の度合いが大きいことがわかります。
まずは、4つの数値変数について、グラフにしてデータの分布を目でみてみましょう。
まず、上の画像のように、function関数を使って、gという名前の関数を作りました。小さい順のグラフ、箱ひげ図、ヒストグラムの3つのグラフをいっぺんに作成する関数です。
それでは、Now(現状)からみてみましょう。
箱ひげ図を見ると、外れ値は無いことがわかります。
NowChg(現状の変化幅)はどうでしょうか?
上にも下にも外れ値があります。
Next(先行き)はどうでしょうか?
先行きも上下に外れ値がありますね。
NextChg(先行きの変化幅)はどうでしょうか?
上に外れ値がありますね。
4つの変数とも分布の形状は山型で、だいたい左右対称ですね。
今回は以上です。