の続きです。
今回はR言語のggolot2パッケージの関数を使ってヒストグラムや箱ひげ図を作図してみようと思います。
まず、「男女」「年齢」「続柄など」の3つのカテゴリ変数に"総数"という値があるので、これを削除したデータセット(tibble)を作成しましょう。
filter関数を使って、"総数"以外を選択しました。table関数で"総数"が0になっていることが確認できます。
まずは、data_exの確認をします。
このようなデータですね。「総数」のヒストグラムを作図してみましょう。ggplot関数のgeom_histgram関数です。
男女で色分けしたヒストグラムを作成してみましょう。color = 男女 というのを加えてみます。
すこしわかりにくいですね。fill = 男女 を試してみましょう。
こちらのほうがわかりやすいですね。でもヒストグラムが重なっているので、どうしても見にくいですね。geom_freqpoly関数を使ってみましょう。
こちらのほうがわかりやすいですね。
さらに、縦軸を個数ではなく、密度で表示してみましょう。y = .. density.. を追加します。
あんまり代わり映えしなかったですね。
geom_boxplot関数を使って箱ひげ図を作図してみます。
x = 男女 として男女別の箱ひげ図を作成しましょう。
女性のほうが中央値が高い位置にあり、男性のほうが外れ値が多いことがわかります。
x = 続柄など としてみましょう。
続柄によって分布に違いがありますね。x軸の表示が重なって読めなくなっているので、coord_flip()を追加します。
これで、どの箱ひげ図がどの属性なのかわかります。さらに中央値を基準にして並び替えて表示しましょう。
これでかなりわかりやすくなりました。
x = 年齢 でもやってみましょう。
きれいにできました。
今回は以上です。
次回は
です。