の続きです。
前回はCSVファイルにあるデータをRに読み込ませて、分析しやすいようにデータフレームを整えました。
今回はデータをグラフにしてみます。
まず、total(全体の入職者数)をヒストグラムにしてみます。
ggplot2パッケージで、ggplot() + geom_histogram()関数でヒストグラムを作成しました。
一部の都道府県は大きな値ですが、大半は300以下です。千人単位なので、30万人以下、ということです。
このtotalをgender別にわけてヒストグラムを描いてみます。
ヒストグラムの形状は性別で大きな違いは無いようです。
次は、year別のヒストグラムを描いてみます。
年によって大きな違いはなさそうです。ただ、totalは左に分布が偏っているので、少しわかりにくいですね。
最小値は2.9と0より大きい値なので、対数に変換してからヒストグラムを描いてみます。
左右対称に近い形状のヒストグラムになりました。
平方根にしたらどうでしょうか?
こんどは、男性と女性を重ねてヒストグラムにしてみます。
position = "identity" にすると、上のように重なります。alpha = 0.5 にして透けて見えるようにしています。
position = "dodge"にすると、
このように、隣同士に描かれます。
position = "stack"にすると、
このように重なります。
男性と女性での違いは無いようですね。
今回は以上です。
今回のヒストグラムのテクニックは、
geom_histogram | ggplot2 でヒストグラムを描く方法 (biopapyrus.jp)
で教えてもらいました。
次回は、
です。
はじめから読むには、
です。