crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の公害苦情件数データの分析5 - R言語のdplyrパッケージのcase_when関数の練習

 

www.crosshyou.info

 の続きです。

今回は、R言語のdplyrパッケージのcase_when関数を学びましたので、さっそく使ってみたいと思います。

case_when関数はifelse関数の複数バージョンでしょうか?

百聞は一見にしかず。やってみます。

今回は、47の都道府県をe-stat(政府統計の総合窓口)の地方類型Iの基準でわけてみようと思います。

地方 類型I

北海道と東北は一つに、九州と沖縄も一つにしてみます。

まずは、それぞれの地方を表すベクトルを作ります。

地方 類型I

こうして各地方を表すベクトルを作ったら、case_when関数でファクターを作ります。

case_when関数



これで47都道府県が各地方に割り当てられました。

2007年の人口100万人当りの苦情件数を各地方ごとに箱ひげ図であらわしてみましょう。

geom_boxplot関数で箱ひげ図

地方別の箱ひげ図

このように地方別の苦情件数の箱ひげ図になります。

北海道・東北地方は少なくて、東海地方は多いとわかります。

最後にreorder関数を使って、中央値の小さい順にregionを並び替えてから箱ひげ図を描いてみます。

reorder関数で並び替え

箱ひげ図

reorder(region, per_total, FUN = median)はregionをper_totalの中央値の順番に並び替える、ということです。

今回は以上です。