の続きです。今回は各変数のヒストグラムを描いてみようと思います。
R言語でヒストグラムを描くには、hist関数が一番簡単です。


山型の分布ですね。
インフレ率(IFR)はこちらです。


大きな外れ値があるために、ヒストグラムの階級が500になっています。これでは大部分が0から500に入ってしまい分布がよくわからないので、ちょっと工夫します。


data$IFR[data$IFR > -10 & data$IFR < 20] とインフレ率のデータの範囲を-10より大きく20未満にしてからヒストグラムを描きました。外れ値は無視してヒストグラムを書いた、ということですね。こうすると、0以下の頻度が少なくて、デフレは例外的な現象だとわかりますね。
失業率(UER)はこうなりました。


経常収支の対GDP比(%)(CAB)はこうなりました。




預金金利も大きな外れ値がありますね。20%以下だけでやってみましょう。


これでわかりやすいヒストグラムになりましたね。
労働年齢比率(ADR)はこうなりました。


以上、全体の各変数のヒストグラムでした。
次は、G7とBRICで分類したヒストグラムを描いてみましょう。これはggplot関数のgeom_histogram関数とfacet_wrap関数でやってみます。
まず、ggplot関数を使えるように、tidyverseのパッケージを読み込みます。

それではggplot関数、geom_histogram関数、facet_wrap関数を使って、G7とBRICに分割したヒストグラムを描いてみましょう。
GDP成長率(GDPG)です。


BRICのほうがバラツキが多いですね。
次はインフレ率です。-10から20の範囲でやりましょう。

data %>%
filter(IFR > -10 & IFR < 20) %>%
としてインフレ率を-10から20に絞り込んでから、ggplot関数を使っています。
そしてできたヒストグラムがこちらです。

BRICのほうがインフレ率のバラツキが大きい感じですね。
失業率はどうでしょうか?


G7のほうがバラツキが大きい感じでしょうか?
経常収支の対GDP比(%)(CAB)はこうなりました。


BRICのほうがバラツキが多いようです。
預金金利(DIR)を見てみましょう。


最後は労働年齢比率(ADR)です。


BRICのほうがバラツキが大きいですね。
今回は以上です。今回はhist関数、ggplot関数、geom_histogram関数、facet_wrap関数とfilter関数を使いました。
次回は
です。