の続きです。今回は各変数のヒストグラムを描いてみようと思います。
R言語でヒストグラムを描くには、hist関数が一番簡単です。
山型の分布ですね。
インフレ率(IFR)はこちらです。
大きな外れ値があるために、ヒストグラムの階級が500になっています。これでは大部分が0から500に入ってしまい分布がよくわからないので、ちょっと工夫します。
data$IFR[data$IFR > -10 & data$IFR < 20] とインフレ率のデータの範囲を-10より大きく20未満にしてからヒストグラムを描きました。外れ値は無視してヒストグラムを書いた、ということですね。こうすると、0以下の頻度が少なくて、デフレは例外的な現象だとわかりますね。
失業率(UER)はこうなりました。
経常収支の対GDP比(%)(CAB)はこうなりました。
預金金利も大きな外れ値がありますね。20%以下だけでやってみましょう。
これでわかりやすいヒストグラムになりましたね。
労働年齢比率(ADR)はこうなりました。
以上、全体の各変数のヒストグラムでした。
次は、G7とBRICで分類したヒストグラムを描いてみましょう。これはggplot関数のgeom_histogram関数とfacet_wrap関数でやってみます。
まず、ggplot関数を使えるように、tidyverseのパッケージを読み込みます。
それではggplot関数、geom_histogram関数、facet_wrap関数を使って、G7とBRICに分割したヒストグラムを描いてみましょう。
GDP成長率(GDPG)です。
BRICのほうがバラツキが多いですね。
次はインフレ率です。-10から20の範囲でやりましょう。
data %>%
filter(IFR > -10 & IFR < 20) %>%
としてインフレ率を-10から20に絞り込んでから、ggplot関数を使っています。
そしてできたヒストグラムがこちらです。
BRICのほうがインフレ率のバラツキが大きい感じですね。
失業率はどうでしょうか?
G7のほうがバラツキが大きい感じでしょうか?
経常収支の対GDP比(%)(CAB)はこうなりました。
BRICのほうがバラツキが多いようです。
預金金利(DIR)を見てみましょう。
最後は労働年齢比率(ADR)です。
BRICのほうがバラツキが大きいですね。
今回は以上です。今回はhist関数、ggplot関数、geom_histogram関数、facet_wrap関数とfilter関数を使いました。
次回は
です。