Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

上場企業の女性役員データの分析1 - R言語で基本統計量を算出

今回は、上場企業の女性役員のデータを分析してみたいと思います。

f:id:cross_hyou:20181225101215j:plain

http://www.gender.go.jp/policy/mieruka/company/yakuin.html

女性役員情報サイトにあった、平成27年4月期~平成28年3月期決算と平成29年4月期~平成30年3月期決算のCSVファイルのデータを使います。

f:id:cross_hyou:20181225102020j:plain

 

こんな感じにCSVファイルにしました。これをread.csv関数でR言語に読込み、summary関数で各変数の統計値サマリーを算出しましょう。

f:id:cross_hyou:20181225102502j:plain

 

平成28年のデータは、3606社、平成30年のデータは、3735社と130社ぐらい増加していますね。一番最後の変数、女性比率が数値ではなくて、文字としてR言語には認識されています。なので、これを、計算しなおしましょう。

f:id:cross_hyou:20181225103018j:plain

あれ?! NAが2つありますね。。男性役員数、女性役員数どちらも NA は無いのにどうしたのでしょうか? NAの行だけ表示したいですね。。is.na関数を使いましょう。

f:id:cross_hyou:20181225104444j:plain

平成30年の千代田インテグレ株式会社と名古屋電機工業株式会社が NA でした。男性役員数も女性役員数もゼロです。これはあきらかにデータがおかしいですね。削除します。1263行目と1304行目を削除します。

f:id:cross_hyou:20181225104901j:plain

NA が無くなっていますね。女性比率の中央値は 0.00 です。平均値は 3.690です。「2020年30%」が政府目標とのことですが、ほど遠いですね。

平成30年と平成28年で区別して女性比率を見てみましょう。tapply関数を使います。

f:id:cross_hyou:20181225105516j:plain

平成28年の平均値は 3.305%で平成30年は 4.062%ですから比率は上がっていますね。第3分位値も平成28年は 7.143%で平成30年は 8.333%と上昇しています。

男性役員数はどうでしょうか?

f:id:cross_hyou:20181225105824j:plain

平均値が平成28人は10.93人で平成30年は10.62人と少し減っています。

第3分位値も平成28年は13人で平成30年は12人と減少しています。私が注目したのは、役員の最大数で平成30年で47人も役員がいる会社があることです。役員会議とかすごそうですね。。どこの会社でしょうか?

f:id:cross_hyou:20181225110346j:plain

 

キヤノンでした。

横道にそれてしまいました。。女性役員数も平成28年と平成29年で比較してみましょう。

f:id:cross_hyou:20181225110728j:plain

平成28年の平均値は、0.378人で平成30年は0.4559人です。第3分位値あどちらも1人です。最大は6人でした。6人の女性役員のいる会社はどこでしょうか?

f:id:cross_hyou:20181225111038j:plain

株式会社シーボンと株式会社かんぽ生命保険が女性役員数6人ですね。シーボンは女性比率が平成30年は50%、平成28年は60%と全社の中で一番の高比率です。

各企業の女性比率の平均はわかりましたが、全体の女性比率、つまり全社の男性役員数合計と女性役員数合計から算出した女性比率も算出しておきましょう。

f:id:cross_hyou:20181225111657j:plain

平成28年の女性役員比率は3.46%でした。

f:id:cross_hyou:20181225112031j:plain

平成30年の女性役員比率は4.29%でした。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。