貯蓄動向調査の分析２ - Ｒ言語のggplot関数の練習(geom_histogram関数、grom_freqpoly関数、geom_point関数)

の続きです。

今回はR言語のggplot関数の練習をしてみます。

まずは、tidyverseパッケージをlibrary関数で呼び出します。

f:id:cross_hyou:20181108155714j:plain

まずは、「世帯数」のヒストグラムを作成してみます。その前にsummary関数で「世帯数」がどんなものか確認しておきましょう。

f:id:cross_hyou:20181108160110j:plain

geom_histogram関数でヒストグラムを作成します。

f:id:cross_hyou:20181108160443j:plain

f:id:cross_hyou:20181108160536j:plain

山が二つある感じですね。そういえば、「世帯タイプ」が勤労者世帯と全世帯の二つに分かれていました。

f:id:cross_hyou:20181108160746j:plain

この「世帯タイプ」と「世帯数」が関係あるのかもしれません。geom_freqpoly関数を使ってみましょう。

f:id:cross_hyou:20181108161130j:plain

f:id:cross_hyou:20181108161203j:plain

思ったとおりです！勤労者世帯が左側の山、全世帯が右側の山でした。

たしかに勤労者世帯は全世帯に含まれますから、全世帯のほうが数が多くなりますね。

geom_histogram関数でやったどうなるでしょうか？

f:id:cross_hyou:20181108161628j:plain

f:id:cross_hyou:20181108161642j:plain

こうなりました。"color = 世帯タイプ"のところを"fill = 世帯タイプ"にしてみましょう。

f:id:cross_hyou:20181108162017j:plain

f:id:cross_hyou:20181108162027j:plain

こちらのほうがわかりやすいですね。

こんどは、geom_point関数で二つの変数の散布図を描きます。「貯蓄」と「負債」

でやってみます。

f:id:cross_hyou:20181108162814j:plain

f:id:cross_hyou:20181108162828j:plain

NAがあるとうまくグラフにならなかったので、na.rm = TRUEを加えています。

これを見ると、画面の右上のほうが全世帯と勤労者世帯の乖離が大きくなっていますね。

勤労者世帯のほうが全世帯と比べて負債が多くなっています。

今回はここまでです。

次回は

です。