の続きです。
今回はいわゆる「前(株)」の会社と「後(株)」の会社で女性役員比率に違いがあるかどうかを検証したいと思います。
まずは、前(株)というのは、「株式会社ABCD」というように、株式会社が社名の前にある会社で、、後(株)というのは、「EFGH株式会社」というように株式会社が社名の後にある会社です。
まずは、前(株)、後(株)を区別するファクター変数を作成しましょう。
まずは、会社名の始めの10社を表示させてみましょう。head関数です。
一番はじめのカネコ種苗株式会社は、後(株)で、その次の株式会社サカタのタネは、前(株)です。これをsubstr関数とifelse関数を使って前(株)か後(株)かのファクター変数を作成します。
まず、substr関数で会社名の始めの4文字だけを取得します。カネコ種苗株式会社はカネコ種、株式会社サカタのタネは株式会社となります。
ifelse関数を使って、株式会社なら「前株」、そうでないなら「後株」としました。table関数で度数を数えると後株が3913社、前株が3426社で後株のほうが多いのですね。
factor関数でファクターに変換しておきましょう。
まずは、tapply関数を使って前株と後株でグループ分けした女性比率を見てみましょう。
前株のほうが、平均値、第3分位値、最大値が高いですね。
カーネル密度グラフを見てみましょう。
下段の後株のほうが山のピークが左よりですね。
それでは、ウィルコクソン=マン・ホイットニー検定で前株と後株の女性比率の分布の位置に違いがあるかを検定してみましょう。wilcox.test検定です。
p-value = 1.118e-09 < 0.05 ですから、前株と後株では女性比率の分布位置に違いがある、ということです。前株の会社のほうが女性比率が高い傾向がるということですね。
女性役員がいるか、いないかでクロス表検定もしてみましょう。
まず、table関数でクロス表を作成しました。後株のほうが女性役員がいない会社が多く、女性役員がいる会社が少ないですね。
chisq.test関数でカイ自乗検定をします。
p-value = 1.093e-05 < 0.05 ですから有意ですね。後株か前株かというのは女性役員がいるかいないかと関連があり、前株の会社のほうが女性役員がいる傾向にあるということです。
最後に全体の合計数値で計算してみましょう。
tapply関数とsum関数をつかって、前株、後株別の男性役員数、女性役員数の合計値を出しましょう。
前株は男性役員数合計:34969人、女性役員数合計:1560人
後株は男性役員数合計:44088人、女性役員数合計:1505人です。
matrix関数でマトリックスを作成し、as.table関数でテーブルに変換してクロス表を作成します。
合計ベースでも後株のほうが男性役員が多く、女性役員が少ないですね。こうして作成したクロス表をカイ自乗検定します。
p-value = 3.694e-13 < 0.05 ですから有意です。前株のほうが女性役員数が多いということですね。
以上の結果から、前株の会社と後株の会社では、前株の会社のほうが女性役員が多い、女性役員比率が多いということがわかりました。
次回は
です。