このブログは上のブログの続きです。
今回はデータをグラフにして視覚化しましょう。
まずは、ヒストグラムです。geom_histogram()関数を使います。
shotokuからいきます。
右端に離れ小島のように高額所得の分布があることがわかります。
次はhokenです。
hokenのほうがなめらから山型の分布ですね。
hoke_shotokuのヒストグラムはどうでしょうか?
hoke_shotoは左に離れ小島がありますね。
つぎは箱ひげ図をみてみます。geom_boxplot()関数を使います。
こんどは年別に箱ひげ図を作成してみました。年による違いはあまりないようです。
上方に2つの外れ値があります。
hokenの箱ひげ図をみてみます。
hokenは1つ、上方に外れ値があります。少しずつ、分布が上にシフトしているように見えます。
hoke_shtoの箱ひげ図をみてみます。
hoke_shotoは下方に1つ外れ値がありますね。
それでは散布図をみてみます。geom_point()関数を使います。都道府県別に描きます。shotokuからです。
big6は青い色になるようにしました。shotokuの外れ値は東京都と神奈川県だったのですね。big6が上位6を占めています。
次はhokenです。
Tokyoが外れ値でした。big6のうち埼玉県と千葉県が上位6位からはずれました。かわりに入ったのが兵庫県、福岡県、奈良県です。
hoke_shotoをみてみます。
下方の外れ値は東京都でしたね。
こうしてみると、東京都は他の府道県と比較していかに異質なのかわかりますね。
今回は以上です。
次回は
はじめから読むには、
です。