Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

厚生年金保険データの分析4 - R言語で各種変数をグラフにして視覚化する。自作関数で簡単に。

 

www.crosshyou.info

 の続きです。

前回は各種変数の大きい都道府県、小さい都道府県を調べました。

今回は各種変数をヒストグラムカーネル密度グラフ、小さい順グラフ、箱ひげ図にて視覚化しましょう。その際に毎回hist関数、plot関数、boxplot関数を呼び出すのは面倒なので4つのグラフを作成する関数を作成して簡単に作成しようと思います。

f:id:cross_hyou:20190105163032j:plain

こんなふうにして、4つのグラフを描く関数を作ります。関数名はgraph_4と名付けました。あとは、graph_4(MF_Ratio)などとすればいいだけです。

f:id:cross_hyou:20190105163317j:plain

f:id:cross_hyou:20190105163331j:plain

被保険者の男女の比率は2つの山がある分布ですね。

報酬の男女比率はどうでしょうか?MF_Wage_Ratioです。

f:id:cross_hyou:20190105163620j:plain

f:id:cross_hyou:20190105163633j:plain

これは山の峰は一つですね。

賞与支払事業所比率、Bonus_Office_Ratioはどうでしょうか?

f:id:cross_hyou:20190105163842j:plain

f:id:cross_hyou:20190105163855j:plain

これも山の峰は一つですね。

 

お次は賞与受取の男女比率です。

f:id:cross_hyou:20190105164131j:plain

f:id:cross_hyou:20190105164143j:plain

値が小さいところに外れ値があるのがわかります。

最後は、男女の賞与金額の格差です。

f:id:cross_hyou:20190105164539j:plain

f:id:cross_hyou:20190105164553j:plain

値の大きいほうに外れ値がいくつかあるのが確認できます。

関数を作ると簡単に4つのグラフが作成できました。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。