の続きです。今回はR言語で国別、地域別、年代別の平均値などを計算してみましょう。R言語のby関数を実行すると簡単です。
このようにby(データフレーム, 分類する列, 実行したい関数)という構文で処理します。
普通にsummary関数を使うと、全ての変数(列)で計算されて、一度に多くの出力がでてしまい、画像を貼り付けできないので、ひとつの変数ずつやってみましょう。
まずは、GDPG(GDP成長率)です。
最小成長率が一番小さい国は、アメリカ(USA)で-2.776%です。
最大成長率が一番大きい国は、中国(CHN)で19.300%です。
平均値が一番大きい国は、中国(CHN)で9.030%です。
平均値が一番小さい国は、ロシア(RUS)で0.7214%です。
次はインフレ率(IFR)を調べてみましょう。
最小インフレ率が一番小さい国は、インド(IND)で-7.634%です。
最大インフレ率が一番大きい国は、ブラジル(BRA)で2947.733%です。
平均インフレ率が一番大きい国は、ブラジル(BRA)で317.377%です。
平均インフレ率が一番小さい国は、ドイツ(DEU)で2.6544%です。
失業率(UER)はどうでしょうか?
最小失業率が一番小さい国は、日本(JPN)で2.090%でした。
最大失業率が一番大きい国は、ロシア(RUS)で13.530%でした。
平均失業率が一番大きい国は、フランス(FRA)で9.865%でした。
平均失業率が一番小さい国は、インド(IND)で3.891%でした。
経常収支の対GDP比%(CAB)をみてみます。
経常収支の対GDP比%の最小値が一番小さい国は、イギリス(GBR)で-5.8424%でした。
経常収支の対GDP比%の最大値が一番大きい国は、日本(JPN)で0.7495%でした。
経常収支の対GDP比%の平均値が一番大きい国は、ロシア(RUS)で5.5714%でした。
経常収支の対GDP比%の平均値が一番小さい国は、アメリカ(USA)で-2.0160%でした。
預金金利(DIR)を調べましょう。
インド(IND)とアメリカ(USA)は預金金利のデータは無かったのですね。
預金金利の最小値が一番小さい国は、日本(JPN)で0.03558%です。
預金金利の最大値が一番大きい国は、ブラジル(BRA)で9394.293%です。
預金金利の平均値が一番大きい国は、ブラジル(BRA)818.860%です。
預金金利の平均値が一番小さい国は、日本(JPN)で2.21386%です。
総人口に対する労働年齢の人口比%(ADR)を調べます。
最小労働年齢比率が一番小さい国は、中国(CHN)で35.59%です。
最大労働年齢比率が一番大きい国は、ブラジル(BRA)で86.14%です。
平均労働年齢比率が一番大きい国は、インド(IND)で67.97%です。
平均労働年齢比率が一番小さい国は、ロシア(RUS)で46.20%です。
地域別(G7/BRIC)の要約統計量を算出しましょう。これはいっぺんに算出します。
平均値だけに注目してBRICとG7を比較すると、
GDP成長率(GDPG)はBRICのほうが高い。
インフレ率(IFR)はBRICのほうが高い。
失業率(UER)はG7のほうが高い。
経常収支比率(CAB)はBRICのほうが高い。
預金金利(DIR)はBRICのほうが高い。
労働者年齢比率(ADR)はBRICのほうが高い。
となりました。
年代別でもやってみましょう。summary関数ではなくて、colMeans関数を使って平均値だけを計算します。
GDP成長率は60年代が一番大きく、90年代が一番小さいです。
インフレ率は90年代が一番大きく、2010年代が一番小さいです。
失業率は60年代、70年代、80年代はなくて、90年代が一番大きく、2010年代が一番小さいです。
経常収支比率は2000年代が一番大きく、60年代が一番小さいです。
預金金利は90年代が一番大きく、2010年代が一番小さいです。
労働年齢人口比率は60年代が一番大きく、2000年代が一番小さいです。
今回は以上です。by関数、summary関数、colMeans関数を使いました。
次回は
です。