www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

World Bank DataBankのG7とBRICのGDPなどの分析３ - R言語で各データのヒストグラムを描く

データ分析

www.crosshyou.info

の続きです。今回は各変数のヒストグラムを描いてみようと思います。

R言語でヒストグラムを描くには、hist関数が一番簡単です。

GDP成長率(GDPG)のヒストグラムはこちらです。

f:id:cross_hyou:20181203121742j:plain

f:id:cross_hyou:20181203121755j:plain

山型の分布ですね。

インフレ率(IFR)はこちらです。

f:id:cross_hyou:20181203121946j:plain

f:id:cross_hyou:20181203121957j:plain

大きな外れ値があるために、ヒストグラムの階級が500になっています。これでは大部分が0から500に入ってしまい分布がよくわからないので、ちょっと工夫します。

f:id:cross_hyou:20181203122815j:plain

f:id:cross_hyou:20181203122828j:plain

data$IFR[data$IFR > -10 & data$IFR < 20] とインフレ率のデータの範囲を-10より大きく20未満にしてからヒストグラムを描きました。外れ値は無視してヒストグラムを書いた、ということですね。こうすると、0以下の頻度が少なくて、デフレは例外的な現象だとわかりますね。

失業率(UER)はこうなりました。

f:id:cross_hyou:20181203123203j:plain

f:id:cross_hyou:20181203123214j:plain

4~5の区間と8~9の区間に山があるような感じです。

経常収支の対GDP比(%)(CAB)はこうなりました。

f:id:cross_hyou:20181203123509j:plain

f:id:cross_hyou:20181203123521j:plain

預金金利(DIR)のヒストグラムです。

f:id:cross_hyou:20181203130720j:plain

f:id:cross_hyou:20181203130734j:plain

預金金利も大きな外れ値がありますね。20%以下だけでやってみましょう。

f:id:cross_hyou:20181203130959j:plain

f:id:cross_hyou:20181203131012j:plain

これでわかりやすいヒストグラムになりましたね。

労働年齢比率(ADR)はこうなりました。

f:id:cross_hyou:20181203123732j:plain

f:id:cross_hyou:20181203123658j:plain

以上、全体の各変数のヒストグラムでした。

次は、G7とBRICで分類したヒストグラムを描いてみましょう。これはggplot関数のgeom_histogram関数とfacet_wrap関数でやってみます。

まず、ggplot関数を使えるように、tidyverseのパッケージを読み込みます。

f:id:cross_hyou:20181203124139j:plain

それではggplot関数、geom_histogram関数、facet_wrap関数を使って、G7とBRICに分割したヒストグラムを描いてみましょう。

GDP成長率(GDPG)です。

f:id:cross_hyou:20181203124720j:plain

f:id:cross_hyou:20181203124744j:plain

BRICのほうがバラツキが多いですね。

次はインフレ率です。-10から20の範囲でやりましょう。

f:id:cross_hyou:20181203125741j:plain

data %>%

filter(IFR > -10 & IFR < 20) %>%

としてインフレ率を-10から20に絞り込んでから、ggplot関数を使っています。

そしてできたヒストグラムがこちらです。

f:id:cross_hyou:20181203125512j:plain

BRICのほうがインフレ率のバラツキが大きい感じですね。

失業率はどうでしょうか？

f:id:cross_hyou:20181203125938j:plain

f:id:cross_hyou:20181203125951j:plain

G7のほうがバラツキが大きい感じでしょうか？

経常収支の対GDP比(%)(CAB)はこうなりました。

f:id:cross_hyou:20181203130252j:plain

f:id:cross_hyou:20181203130304j:plain

BRICのほうがバラツキが多いようです。

預金金利(DIR)を見てみましょう。

f:id:cross_hyou:20181203131316j:plain

f:id:cross_hyou:20181203131327j:plain

最後は労働年齢比率(ADR)です。

f:id:cross_hyou:20181203131525j:plain

f:id:cross_hyou:20181203131540j:plain

BRICのほうがバラツキが大きいですね。

今回は以上です。今回はhist関数、ggplot関数、geom_histogram関数、facet_wrap関数とfilter関数を使いました。

次回は

www.crosshyou.info

です。