の続きです。今回はdplyrパッケージの主要5関数、filter関数、arrange関数、select関数、mutate関数、summarize関数の練習をしようと思います。
まず、library(dplyr)としてパッケージを呼び込みます。

filter関数はある条件でデータを絞り込むときに使います。
例えば、12月のデータだけに絞り込みましょう。

二つの条件をANDでつなぐには、 , で列記すればいいです。
例えば、12月でL5が1.0以上のデータだけに絞り込みしてみます。

二つの条件をORでつなぐには、 | で列記します。
例えば、2008年と2018年のデータだけに絞り込みましょう。

arrenage関数は並び替えます。L5の小さい順に表示します。

head関数を加えてはじめの6行だけの表示にしています。
大きい順に表示するには、desc(L5)としてやります。

変数を , で列記すれば、複数の列で並び替えもできます。L5の小さい順でL52の小さい順をやってみましょう。

select関数は表示したい変数を選択できます。Year, Month, Assetだけを表示しましょう。

わざとYear, Asset, Month として表示する順番を変えてみました。
mutate関数は新しい変数を追加します。L5 + L52 + L2 を LL, U2 + U25 + U5 をUUとした新しい変数を作ってみましょう。

summarize関数はデータフレーム1行に要約します。例えば、LLの平均値を出しましょう。

LLの全期間の平均は6.827%, UUの全期間の平均は65.87%です。
summarize関数はgroup_by関数と組み合わせると更に協力になります。年毎のLLとUUの平均値を計算します。

月ごとのLLとUUの平均値も計算してみます。

今回は以上です。
次回は
です。