Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

World Bank DataBankのG7とBRICのGDPなどの分析2 - R言語で国別、地域別、年代別の基本統計量を算出する

 

www.crosshyou.info

 の続きです。今回はR言語で国別、地域別、年代別の平均値などを計算してみましょう。R言語のby関数を実行すると簡単です。

f:id:cross_hyou:20181201110822j:plain

 

このようにby(データフレーム, 分類する列, 実行したい関数)という構文で処理します。

普通にsummary関数を使うと、全ての変数(列)で計算されて、一度に多くの出力がでてしまい、画像を貼り付けできないので、ひとつの変数ずつやってみましょう。

まずは、GDPG(GDP成長率)です。

f:id:cross_hyou:20181201120020j:plain

 

最小成長率が一番小さい国は、アメリカ(USA)で-2.776%です。

最大成長率が一番大きい国は、中国(CHN)で19.300%です。

平均値が一番大きい国は、中国(CHN)で9.030%です。

平均値が一番小さい国は、ロシア(RUS)で0.7214%です。

 

次はインフレ率(IFR)を調べてみましょう。

f:id:cross_hyou:20181201120658j:plain

 

最小インフレ率が一番小さい国は、インド(IND)で-7.634%です。

最大インフレ率が一番大きい国は、ブラジル(BRA)で2947.733%です。

平均インフレ率が一番大きい国は、ブラジル(BRA)で317.377%です。

平均インフレ率が一番小さい国は、ドイツ(DEU)で2.6544%です。

 

失業率(UER)はどうでしょうか?

f:id:cross_hyou:20181201121242j:plain

最小失業率が一番小さい国は、日本(JPN)で2.090%でした。

最大失業率が一番大きい国は、ロシア(RUS)で13.530%でした。

平均失業率が一番大きい国は、フランス(FRA)で9.865%でした。

平均失業率が一番小さい国は、インド(IND)で3.891%でした。

 

経常収支の対GDP比%(CAB)をみてみます。

f:id:cross_hyou:20181201122713j:plain

 

経常収支の対GDP比%の最小値が一番小さい国は、イギリス(GBR)で-5.8424%でした。

経常収支の対GDP比%の最大値が一番大きい国は、日本(JPN)で0.7495%でした。

経常収支の対GDP比%の平均値が一番大きい国は、ロシア(RUS)で5.5714%でした。

経常収支の対GDP比%の平均値が一番小さい国は、アメリカ(USA)で-2.0160%でした。

 

預金金利(DIR)を調べましょう。

f:id:cross_hyou:20181201123628j:plain

 

インド(IND)とアメリカ(USA)は預金金利のデータは無かったのですね。

預金金利の最小値が一番小さい国は、日本(JPN)で0.03558%です。

預金金利の最大値が一番大きい国は、ブラジル(BRA)で9394.293%です。

預金金利の平均値が一番大きい国は、ブラジル(BRA)818.860%です。

預金金利の平均値が一番小さい国は、日本(JPN)で2.21386%です。

 

総人口に対する労働年齢の人口比%(ADR)を調べます。

f:id:cross_hyou:20181201124638j:plain

 

最小労働年齢比率が一番小さい国は、中国(CHN)で35.59%です。

最大労働年齢比率が一番大きい国は、ブラジル(BRA)で86.14%です。

平均労働年齢比率が一番大きい国は、インド(IND)で67.97%です。

平均労働年齢比率が一番小さい国は、ロシア(RUS)で46.20%です。

 

地域別(G7/BRIC)の要約統計量を算出しましょう。これはいっぺんに算出します。

f:id:cross_hyou:20181201125319j:plain

 

平均値だけに注目してBRICとG7を比較すると、

GDP成長率(GDPG)はBRICのほうが高い。

インフレ率(IFR)はBRICのほうが高い。

失業率(UER)はG7のほうが高い。

経常収支比率(CAB)はBRICのほうが高い。

預金金利(DIR)はBRICのほうが高い。

労働者年齢比率(ADR)はBRICのほうが高い。

となりました。

 

年代別でもやってみましょう。summary関数ではなくて、colMeans関数を使って平均値だけを計算します。

f:id:cross_hyou:20181201130914j:plain

 

GDP成長率は60年代が一番大きく、90年代が一番小さいです。

インフレ率は90年代が一番大きく、2010年代が一番小さいです。

失業率は60年代、70年代、80年代はなくて、90年代が一番大きく、2010年代が一番小さいです。

経常収支比率は2000年代が一番大きく、60年代が一番小さいです。

預金金利は90年代が一番大きく、2010年代が一番小さいです。

労働年齢人口比率は60年代が一番大きく、2000年代が一番小さいです。

今回は以上です。by関数、summary関数、colMeans関数を使いました。

 次回は

 

www.crosshyou.info

 

です。