crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

厚生年金保険データの分析6 - R言語で各変数を偏差値に換算してどの都道府県が男性優位か女性有意かを総合的に判断してみる。

 

www.crosshyou.info

 の続きです。今回はR言語で各変数を偏差値に変換して、どの都道府県が男性優位か女性有意かを総合的に判断したいと思います。

まず、偏差値の計算式ですが、(観測値 - 平均値) x 10 / 標準偏差 + 50 という式ですね。

早速計算してみましょう。

まずは、MFR(男性の人数と女性の人数の比率)です。

f:id:cross_hyou:20190108151456j:plain

平均値が50.00になっていますね。

次は、MFWR(男性の月額報酬と女性の月額報酬の比率を偏差値にします。

f:id:cross_hyou:20190108151952j:plain

続いて、MFBR(賞与を受け取った男性の人数と賞与を受け取った女性の人数の比率)です。

f:id:cross_hyou:20190108152324j:plain

最小値の16.17ってかなり低い偏差値ですよね。

最後にMFBVR(男性の賞与額と女性の賞与額の比率)です。

f:id:cross_hyou:20190108152649j:plain

最大値の91.85って凄い高い偏差値ですね。こんな高い偏差値見たことないです。

こうして計算した4つの偏差値を合計した総合得点を算出して、都道府県の名前を付与してやりましょう。

f:id:cross_hyou:20190108153040j:plain

さあ、いよいよ緊張の一瞬です。sort関数で小さい順に並び替えて表示します。値が小さいほど女性優位、値が大きいほど男性優位ということです。

f:id:cross_hyou:20190108153305j:plain

でました!沖縄が一番女性優位です。愛知が一番男性優位です。

barplot関数で棒グラフにしてみます。

f:id:cross_hyou:20190108153619j:plain

f:id:cross_hyou:20190108153659j:plain

こうしてグラフにすると、一番右の愛知が突出して高いのがわかります。

このMF_ScoreとBOR(賞与支払い事業所率)の相関関係をcor.test関数でみてみましょう。

f:id:cross_hyou:20190108153956j:plain

p-value = 0.02925で0.05よりも小さいp値なので、有意な相関関係です。相関係数は一番下の行の-0.3182441ですから逆相関です。男性優位度の高い&ボーナスを支払う事業所少ない、男性優位度低い&ボーナスを支払う事業所多いという相関関係ですね。

lm関数で回帰分析をしてみましょう。BOR = a + b x MF_Score という回帰式でやってみます。

f:id:cross_hyou:20190108154615j:plain

一番下の行にこの回帰式が有意かどうかを判断するp値があります。p-value = 0.02925なので0.05よりも小さいので、この回帰式は有意です。CoefficientsのEstimateのところが回帰式の係数になります。

BOR = 25.22344 - 0.05027 x MF_Score

という回帰式ですね。

最後にplot関数で回帰式をグラフで表現します。

f:id:cross_hyou:20190108155158j:plain

f:id:cross_hyou:20190108155209j:plain

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。