の続きです。
今回は、平成28年の女性役員比率と平成30年の女性役員比率は有意な違いなのかどうかを調べてみようと思います。
前回の分析で、平成28年の男性役員数は合計で39422人、女性役員数は合計で1363人、平成30年の男性役員数は合計で39635人、女性役員数は合計で1702人とわかりました。
このデータでクロス表を作り、R言語のchisq.test関数で有意かどうかを検定します。
matrix関数、c関数, colnames関数, rownames関数, as.table関数を使って上図のようにクロス表を作成しました。prop.table関数で割合表示にしてみましょう。
margin = 1 として行の合計が100%になるようにしています。平成28年の女性役員比率は、3.34%で、平成30年の女性役員比率は、4.12%です。
早速 chisq.test関数でカイ自乗検定をしましょう。
p-value = 5.118e-09 < 0.05 ですから、平成28年と平成30年では男女の役員比率に有意な違いがあることがわかりました。
違う観点からも女性役員が増えていることを確認しましょう。女性役員がいる企業をw, 女性役員がいない企業をnon-wと2つのグループにわけて、平成28年と平成30年で違いがあるかどうかを調べます。ifelse関数を使って2つのグループに分けます。
女性役員がいない会社が平成28年と平成30年合計で4937社、女性役員がいる会社が2402社ですね。table関数でクロス表を作ります。
平成28年は、女性役員のいる会社が1075社、平成30年は1327社と増加しています。prop.table関数で割合表示にしてみます。
平成28年は女性役員のいる会社は29.8%で、平成30年は35.5%と増加しています。
カイ自乗検定をchisq.test関数で実行します。
p-value = 1.879e-07 < 0.05 ですから有意です。平成28年と平成30年では女性役員のいる会社の割合は有意な差があるということです。
次は、個々の会社ベースで計算されている女性役員比率の分布状況が平成28年と平成30年で違いがあるかどうかを検定しましょう。まず、2つのデータに分布をplot関数とdensity関数で視覚化してみます。
0%の水準が一番大きいですが、8%ぐらいのところにも山があります。abline(v = 8, col = "red")として赤い垂直線を8%のところにひいてみました。
平成30年はどうでしょうか?
青い線を8%のところに置きました。すこし山の高さが高くなってる感じですね。
ウィルコクソン=マン・ホイットニー検定, wilcox.test関数を使います。
p-value = 4.607e-08 < 0.05 ですから、平成28年と平成30年の女性比率の分布位置は有意な違いがあります。
以上の分析で、全体の集計ベース、女性役員がいるかいないかの2値ベース、個々の会社の女性比率の分布ベースの3つの基準で、平成28年と平成30年では女性比率に違いがあり、平成30年のほうが女性比率が高いことがわかりました。
次回は
です。