crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

小売物価統計調査の全国統一品目のデータ分析4 - R言語のggplot2パッケージのgeom_histogram関数でヒストグラムを描く。

 

www.crosshyou.info

 の続きです。

今回は各変数のヒストグラムを見てみようと思います。ggplot2パッケージの中のgeom_histogram()関数を利用します。

geom_histogram関数でヒストグラム

ヒストグラム

ほとんどの品目は低下価格ですが、6つの品目が高額なため、よくわからないヒストグラムになっています。

dplyrパッケージのarrange関数で高額な品目とその価格を見てみましょう。

arrange関数

ピアノが72万6000円で、ピアノの次が自動車保険料の7万4330円です。自動車保険ってこんなに高いいんですね。自動車に乗らないからわからなかったです。

filter関数でピアノや自動車を除いてから、もう一度ヒストグラムを作ってみます。

filter関数とgeom_histogram関数

ヒストグラム

だいぶわかりやすくなりました。3万円以下の商品だけにしてヒストグラムを作ってみましょう。

filter関数とgeom_histogram関数

ヒストグラム

こうしてみると、値段の安いものになるほど、品目が多いですね。

Y202007を対数変換してからヒストグラムを描いてみましょう。mutate関数とlog関数を使います。

mutate関数とlog関数

ヒストグラム

ようやく分布の中心に多くの品目が集まるようになりました。

binwidth = 1にしてみます。

 

binwidth = 1

ヒストグラム

color = "white" にして見やすくしました。

Y202006も同じようにヒストグラムにします。

mutate関数とlog関数

ヒストグラム

2020年7月とほとんど同じですね。

Y201907も同じようにヒストグラムにします。

mutate関数とlog関数

ヒストグラム

こちらも同じような形状です。

続いて、価格の変化率、Month_chgを見てみます。

geom_histogram関数でヒストグラム

ヒストグラム

価格の変化が無い、1.0が圧倒的に多いことがわかります。

Year_chgを見ましょう。

geom_histogram関数でヒストグラム

ヒストグラム

右がわにポツンとあるのは確か、銀行振り込み料金でした。

これを除いてヒストグラムを描いてみましょう。

filter関数とgeom_histogram関数

ヒストグラム

少しだけ価格が上昇している品目が多いです。

今回は以上です。