Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の雇用動向調査のデータ分析2 - 入職者数のヒストグラムを男性・女性別に重ねてヒストグラムにする。

UnsplashSigmundが撮影した写真 

www.crosshyou.info

の続きです。

前回はCSVファイルにあるデータをRに読み込ませて、分析しやすいようにデータフレームを整えました。

今回はデータをグラフにしてみます。

まず、total(全体の入職者数)をヒストグラムにしてみます。

ggplot2パッケージで、ggplot() + geom_histogram()関数でヒストグラムを作成しました。

一部の都道府県は大きな値ですが、大半は300以下です。千人単位なので、30万人以下、ということです。

このtotalをgender別にわけてヒストグラムを描いてみます。

ヒストグラムの形状は性別で大きな違いは無いようです。

次は、year別のヒストグラムを描いてみます。

年によって大きな違いはなさそうです。ただ、totalは左に分布が偏っているので、少しわかりにくいですね。

最小値は2.9と0より大きい値なので、対数に変換してからヒストグラムを描いてみます。

左右対称に近い形状のヒストグラムになりました。

平方根にしたらどうでしょうか?

こんどは、男性と女性を重ねてヒストグラムにしてみます。

position = "identity" にすると、上のように重なります。alpha = 0.5 にして透けて見えるようにしています。

position = "dodge"にすると、

このように、隣同士に描かれます。

position = "stack"にすると、

このように重なります。

男性と女性での違いは無いようですね。

今回は以上です。

今回のヒストグラムのテクニックは、
geom_histogram | ggplot2 でヒストグラムを描く方法 (biopapyrus.jp)

で教えてもらいました。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。