www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費動向調査データの分析3 - R言語のdplyrパッケージの主要5関数(filter, arrange, select, mutate, summarize)の練習

 

www.crosshyou.info

 の続きです。今回はdplyrパッケージの主要5関数、filter関数、arrange関数、select関数、mutate関数、summarize関数の練習をしようと思います。

まず、library(dplyr)としてパッケージを呼び込みます。

f:id:cross_hyou:20190204150625j:plain

filter関数はある条件でデータを絞り込むときに使います。

例えば、12月のデータだけに絞り込みましょう。

f:id:cross_hyou:20190204150829j:plain

二つの条件をANDでつなぐには、 , で列記すればいいです。

例えば、12月でL5が1.0以上のデータだけに絞り込みしてみます。

f:id:cross_hyou:20190204151114j:plain

二つの条件をORでつなぐには、 | で列記します。

例えば、2008年と2018年のデータだけに絞り込みましょう。

f:id:cross_hyou:20190204151328j:plain

arrenage関数は並び替えます。L5の小さい順に表示します。

f:id:cross_hyou:20190204151506j:plain

head関数を加えてはじめの6行だけの表示にしています。

大きい順に表示するには、desc(L5)としてやります。

f:id:cross_hyou:20190204151812j:plain

変数を , で列記すれば、複数の列で並び替えもできます。L5の小さい順でL52の小さい順をやってみましょう。

f:id:cross_hyou:20190204152044j:plain

 

select関数は表示したい変数を選択できます。Year, Month, Assetだけを表示しましょう。

f:id:cross_hyou:20190204152248j:plain

わざとYear, Asset, Month として表示する順番を変えてみました。

mutate関数は新しい変数を追加します。L5 + L52 + L2 を LL, U2 + U25 + U5 をUUとした新しい変数を作ってみましょう。

f:id:cross_hyou:20190204153601j:plain

summarize関数はデータフレーム1行に要約します。例えば、LLの平均値を出しましょう。

f:id:cross_hyou:20190204154725j:plain


LLの全期間の平均は6.827%, UUの全期間の平均は65.87%です。

summarize関数はgroup_by関数と組み合わせると更に協力になります。年毎のLLとUUの平均値を計算します。

f:id:cross_hyou:20190204154824j:plain

月ごとのLLとUUの平均値も計算してみます。

f:id:cross_hyou:20190204155221j:plain

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。