Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

厚生年金保険データの分析2 - R言語で各種比率を計算する

 

www.crosshyou.info

 の続きです。

今回は、被保険者数の男女の比率、男女の賃金格差、賞与を支払った事業所の比率、賞与を受け取った男女の比率、男女の賞与の格差を計算していきたいと思います。

まず、str関数でデータの各変数を確認しましょう。

f:id:cross_hyou:20190105103332j:plain

都道府県はファクターで、その他は全て整数です。

それでは早速、被保険者の男女の比率を計算しましょう。一般男子数 / 女子数 で計算できますね。

f:id:cross_hyou:20190105103724j:plain

最小値は、1.229で最大値が2.164で平均値は1.519です。さすがに女子のほうが多い都道府県はありませんね。

男女の賃金格差はどうでしょうか? 一般男子月額報酬 / 女子月額報酬 で計算します。

f:id:cross_hyou:20190105104155j:plain

最小値は、1.320で最大値が1.528で平均値は1.427です。男性のほうが女性よりも約4割増しの報酬を得ていることがわかります。

賞与を支払った事業所比率を計算します。 賞与支払事業所数 / 事業所数 ですね。

f:id:cross_hyou:20190105104718j:plain

100を掛けてパーセント表示にしています。最小は6.665%、最大は23.438%、平均値は15.169%です。

賞与を受け取った男女の人数の比率を計算します。賞与受取一般男子 / 賞与受取女子 で計算します。

f:id:cross_hyou:20190105105249j:plain

お!最小値が0.9524と1を割っています。これは女子のほうが賞与を受け取った人数の多い都道府県があるっていうことですね。どこの都道府県でしょうか?後で調べてみましょう。

最後は男女の賞与の金額の比率です。賞与額平均一般男子 / 賞与額平均女子 で計算できます。

f:id:cross_hyou:20190105105905j:plain

最小値は1.216、最大値は2.162、平均値は2.162です。月額報酬よりもバラツキが大きいようですね。変動係数を計算してバラツキがどちらが大きいか比較してみましょう。変動係数は、標準偏差 / 平均値 で計算できます。

f:id:cross_hyou:20190105110427j:plain

月額報酬の変動係数は、0.035で賞与の変動係数は、0.125ですからやはり、賞与のほうがバラツキが大きいですね。

これからの分析がしやすいように、計算した各種比率と都道府県を合わせたデータフレームを作成しましょう。data.frame関数でデータフレームが作成できます。

f:id:cross_hyou:20190105111545j:plain

data.frame関数では、Pref = data$都道府県 のようにすることで変数名を任意の名前に変更することが可能です。

今回は以上です。

次回は

 

です。