crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

小売物価統計調査の全国統一品目のデータ分析2 - R言語のdplyrパッケージのmutate関数で新しい変数を作る。

 

www.crosshyou.info

 の続きです。

今回は、R言語のdplyrパッケージのmutate関数で新しい変数を作ります。

はじめにtidyverseパッケージを読み込みます。

tidyverseパッケージ

tidyverseパッケージを読み込むと、dplyrパッケージをはじめggplot2などデータ分析で便利なパッケージをいっぺんに読み込みます。

では、mutate関数でY202007 / Y202006 を作ります。これは2020年6月と2020年7月なので、Month_chgと名前をつけましょう。

mutate関数

Month_chg:前月変化率は最小で0.9615ですから4%ぐらい価格が下がったものがあります。その一方で、最大が1.312なので3割も値上がりした品目があります。

同じように、Y202007 / Y201907 を作ります。これはYear_chgと名前をつけましょう。

mutate関数

最小値は0.8092ですから2割ぐらい値下がりした品目があります。最大値は4.5926ですから、4.5倍に値上がりした品目もあるのですね。

Month_chgが1.000つまり前月の価格が同じだったらTrue, 価格が変わっていたらFalseという変数も作りましょう。これはMonth_sameと名前をつけましょう。

mutate関数

TRUEが109ということは、109品目は前月と同じ価格、FALSEが29ということは29品目は前月と違う価格ということです。

同じように、Year_chgが1.000ならTRUE, 違うならFALSEというYear_sameという変数を作りましょう。

mutate関数

TRUEが12ですので、12品目は昨年と価格が同じということですね。

最後にMonth_chg, Year_chgが両方ともTRUE, つまり価格が2019年7月、2020年6月、2020年7月で価格が変わっていないものをTRUE, そうでないものをFALSEとする変数を作りましょう、Anteiと名前をつけましょう。

mutate関数

TRUEが12ということは、Year_sameと同じ数なので、Year_sameがTRUEな品目12品目はすべてAnteiもTRUEということですね。Anteiは作らなくてもよかったですね。

NULLで削除しましょう。

NULL

str関数でみると、Anteiが無くなっていることが確認できます。

今回は以上です。