Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

日銀短観2019年12月調査のデータ分析1 - R言語でヒストグラムや箱ひげ図を作成する。

今回は先日発表発表された日銀短観2019年12月調査のデータを分析してみようと思います。

短観 : 日本銀行 Bank of Japan

f:id:cross_hyou:20191214112708p:plain

上の画像のZIPファイルの中にあるExcelファイルをダウンロードしました。

f:id:cross_hyou:20191214112948p:plain

こういうファイルです。

これをR言語で分析しようと思います。

f:id:cross_hyou:20191214114416p:plain

こんな感じでCSVファイルにしました。これをread.csv関数でR言語に読込みます。

f:id:cross_hyou:20191214115224p:plain

head関数ではじめの6行だけ表示しました。

summary関数で基本的な統計値を確認しましょう。

f:id:cross_hyou:20191214115434p:plain

Sector, Industry, Sizeがカテゴリカル変数で、Now, NowChg, Next, NextChgが数値変数ですね。短観は0より大きければ景気が良い、0よりも小さければ景気が悪いことを意味します。Nowは現状、Nextは先行きです。どちらの平均値も中央値も0よりも大きいですので、景気は良いのですね。NowChgが現状の変化幅(前回調査との比較)、NextChgが先行きの変化幅です。どちらの平均値、中央値もマイナスですから、前回の調査と比べると景況感は悪化している、ということですね。

 

数値変数については、分散、標準偏差、変動係数も調べてみましょう。

var関数で分散、sd関数で標準偏差、sd関数 / mean関数で変動係数です。

f:id:cross_hyou:20191214120132p:plain

apply関数と組み合わせて4つの変数についていっぺんに計算しました。

変動係数を見ると、Next(先行き)が一番変動の度合いが大きいことがわかります。

まずは、4つの数値変数について、グラフにしてデータの分布を目でみてみましょう。

f:id:cross_hyou:20191214122844p:plain


まず、上の画像のように、function関数を使って、gという名前の関数を作りました。小さい順のグラフ、箱ひげ図、ヒストグラムの3つのグラフをいっぺんに作成する関数です。

それでは、Now(現状)からみてみましょう。

f:id:cross_hyou:20191214123427p:plain

f:id:cross_hyou:20191214123440p:plain

箱ひげ図を見ると、外れ値は無いことがわかります。

NowChg(現状の変化幅)はどうでしょうか?

f:id:cross_hyou:20191214123734p:plain

f:id:cross_hyou:20191214123746p:plain

上にも下にも外れ値があります。

Next(先行き)はどうでしょうか?

f:id:cross_hyou:20191214124000p:plain

f:id:cross_hyou:20191214124011p:plain

先行きも上下に外れ値がありますね。

NextChg(先行きの変化幅)はどうでしょうか?

f:id:cross_hyou:20191214124252p:plain

f:id:cross_hyou:20191214124302p:plain

上に外れ値がありますね。

4つの変数とも分布の形状は山型で、だいたい左右対称ですね。

今回は以上です。