の続きです。今回はR言語で各変数を偏差値に変換して、どの都道府県が男性優位か女性有意かを総合的に判断したいと思います。
まず、偏差値の計算式ですが、(観測値 - 平均値) x 10 / 標準偏差 + 50 という式ですね。
早速計算してみましょう。
まずは、MFR(男性の人数と女性の人数の比率)です。
平均値が50.00になっていますね。
次は、MFWR(男性の月額報酬と女性の月額報酬の比率を偏差値にします。
続いて、MFBR(賞与を受け取った男性の人数と賞与を受け取った女性の人数の比率)です。
最小値の16.17ってかなり低い偏差値ですよね。
最後にMFBVR(男性の賞与額と女性の賞与額の比率)です。
最大値の91.85って凄い高い偏差値ですね。こんな高い偏差値見たことないです。
こうして計算した4つの偏差値を合計した総合得点を算出して、都道府県の名前を付与してやりましょう。
さあ、いよいよ緊張の一瞬です。sort関数で小さい順に並び替えて表示します。値が小さいほど女性優位、値が大きいほど男性優位ということです。
でました!沖縄が一番女性優位です。愛知が一番男性優位です。
barplot関数で棒グラフにしてみます。
こうしてグラフにすると、一番右の愛知が突出して高いのがわかります。
このMF_ScoreとBOR(賞与支払い事業所率)の相関関係をcor.test関数でみてみましょう。
p-value = 0.02925で0.05よりも小さいp値なので、有意な相関関係です。相関係数は一番下の行の-0.3182441ですから逆相関です。男性優位度の高い&ボーナスを支払う事業所少ない、男性優位度低い&ボーナスを支払う事業所多いという相関関係ですね。
lm関数で回帰分析をしてみましょう。BOR = a + b x MF_Score という回帰式でやってみます。
一番下の行にこの回帰式が有意かどうかを判断するp値があります。p-value = 0.02925なので0.05よりも小さいので、この回帰式は有意です。CoefficientsのEstimateのところが回帰式の係数になります。
BOR = 25.22344 - 0.05027 x MF_Score
という回帰式ですね。
最後にplot関数で回帰式をグラフで表現します。
今回は以上です。
次回は
です。