の続きです。
今回はR言語のggplot関数の練習をしてみます。
まずは、tidyverseパッケージをlibrary関数で呼び出します。
まずは、「世帯数」のヒストグラムを作成してみます。その前にsummary関数で「世帯数」がどんなものか確認しておきましょう。
geom_histogram関数でヒストグラムを作成します。
山が二つある感じですね。そういえば、「世帯タイプ」が勤労者世帯と全世帯の二つに分かれていました。
この「世帯タイプ」と「世帯数」が関係あるのかもしれません。geom_freqpoly関数を使ってみましょう。
思ったとおりです!勤労者世帯が左側の山、全世帯が右側の山でした。
たしかに勤労者世帯は全世帯に含まれますから、全世帯のほうが数が多くなりますね。
geom_histogram関数でやったどうなるでしょうか?
こうなりました。"color = 世帯タイプ"のところを"fill = 世帯タイプ"にしてみましょう。
こちらのほうがわかりやすいですね。
こんどは、geom_point関数で二つの変数の散布図を描きます。「貯蓄」と「負債」
でやってみます。
NAがあるとうまくグラフにならなかったので、na.rm = TRUEを加えています。
これを見ると、画面の右上のほうが全世帯と勤労者世帯の乖離が大きくなっていますね。
勤労者世帯のほうが全世帯と比べて負債が多くなっています。
今回はここまでです。
次回は
です。