の続きです。今回はdplyrパッケージの主要5関数、filter関数、arrange関数、select関数、mutate関数、summarize関数の練習をしようと思います。
まず、library(dplyr)としてパッケージを呼び込みます。
filter関数はある条件でデータを絞り込むときに使います。
例えば、12月のデータだけに絞り込みましょう。
二つの条件をANDでつなぐには、 , で列記すればいいです。
例えば、12月でL5が1.0以上のデータだけに絞り込みしてみます。
二つの条件をORでつなぐには、 | で列記します。
例えば、2008年と2018年のデータだけに絞り込みましょう。
arrenage関数は並び替えます。L5の小さい順に表示します。
head関数を加えてはじめの6行だけの表示にしています。
大きい順に表示するには、desc(L5)としてやります。
変数を , で列記すれば、複数の列で並び替えもできます。L5の小さい順でL52の小さい順をやってみましょう。
select関数は表示したい変数を選択できます。Year, Month, Assetだけを表示しましょう。
わざとYear, Asset, Month として表示する順番を変えてみました。
mutate関数は新しい変数を追加します。L5 + L52 + L2 を LL, U2 + U25 + U5 をUUとした新しい変数を作ってみましょう。
summarize関数はデータフレーム1行に要約します。例えば、LLの平均値を出しましょう。
LLの全期間の平均は6.827%, UUの全期間の平均は65.87%です。
summarize関数はgroup_by関数と組み合わせると更に協力になります。年毎のLLとUUの平均値を計算します。
月ごとのLLとUUの平均値も計算してみます。
今回は以上です。
次回は
です。