Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の後期高齢者医療制度被保険者実態調査のデータ分析2 - R言語でヒストグラム、箱ひげ図、散布図を描く。

 

f:id:cross_hyou:20210723151027j:plain

Photo by JUNHØ on Unsplash

www.crosshyou.info

このブログは上のブログの続きです。

今回はデータをグラフにして視覚化しましょう。

まずは、ヒストグラムです。geom_histogram()関数を使います。

shotokuからいきます。

f:id:cross_hyou:20210723151251p:plain

f:id:cross_hyou:20210723151305p:plain

右端に離れ小島のように高額所得の分布があることがわかります。

次はhokenです。

f:id:cross_hyou:20210723151458p:plain

f:id:cross_hyou:20210723151513p:plain

hokenのほうがなめらから山型の分布ですね。

hoke_shotokuのヒストグラムはどうでしょうか?

f:id:cross_hyou:20210723151639p:plain

f:id:cross_hyou:20210723151654p:plain

hoke_shotoは左に離れ小島がありますね。

つぎは箱ひげ図をみてみます。geom_boxplot()関数を使います。

f:id:cross_hyou:20210723151816p:plain

f:id:cross_hyou:20210723151827p:plain

こんどは年別に箱ひげ図を作成してみました。年による違いはあまりないようです。

上方に2つの外れ値があります。

hokenの箱ひげ図をみてみます。

f:id:cross_hyou:20210723152030p:plain

f:id:cross_hyou:20210723152041p:plain

hokenは1つ、上方に外れ値があります。少しずつ、分布が上にシフトしているように見えます。

hoke_shtoの箱ひげ図をみてみます。

f:id:cross_hyou:20210723152321p:plain

f:id:cross_hyou:20210723152331p:plain

hoke_shotoは下方に1つ外れ値がありますね。

それでは散布図をみてみます。geom_point()関数を使います。都道府県別に描きます。shotokuからです。

f:id:cross_hyou:20210723152505p:plain

f:id:cross_hyou:20210723152517p:plain

big6は青い色になるようにしました。shotokuの外れ値は東京都と神奈川県だったのですね。big6が上位6を占めています。

次はhokenです。

f:id:cross_hyou:20210723152725p:plain

f:id:cross_hyou:20210723152740p:plain

Tokyoが外れ値でした。big6のうち埼玉県と千葉県が上位6位からはずれました。かわりに入ったのが兵庫県、福岡県、奈良県です。

hoke_shotoをみてみます。

f:id:cross_hyou:20210723153031p:plain

f:id:cross_hyou:20210723153042p:plain

下方の外れ値は東京都でしたね。

こうしてみると、東京都は他の府道県と比較していかに異質なのかわかりますね。

今回は以上です。

次回は

 

www.crosshyou.info

 

はじめから読むには、

 

www.crosshyou.info

 です。