の続きです。
今回は2012年と2016年で男女比率が変化したかどうかをR言語で調べてみたいと思います。
まず、2012年の男女比率を見てみましょう。
まず、計算に必要なデータを抽出します。
計算してみましょう。
男女比率の高い順に並び替えましょう。order関数を使います。
中京、関東、宇都宮都市圏が男女比率が高い、すなわち男性従業者数が多く、熊本、松山、鹿児島都市圏が男女比率が低い、すなわち女性従業者数が多いことがわかります。
同じようなことを2016年のデータでもやってみましょう。今回はsubset関数で2016年のデータフレームを作成します。
男女比率を同じように作成して大きい順に並び替えます
男女比率が高いのは、中京、宇都宮、関東です。低いのは鹿児島、松山、熊本です。
それでは2012年と2016年の変化幅を計算してみます。
松山都市圏だけが男女比率が増加しています。13地域が男女比率は減少、1地域が増加です。この割合は統計的に有意でしょうか?増加・減少が50%50%の確率で起こるとして13増加:1減少になる確率はどのくらいでしょうか?dbinom関数で計算してみましょう。
半々の確率で増加または減少になるとき、13増加、1減少になる確率はわずか0.0008544922です。半々の確率ではない、ということですね。
それぞれの年の男性従業者、女性従業者の合計値を算出してみます。
2012年の男性従業者数合計は、2253万8237人、女性従業者合計は1707万8321人です。
2016年の男性従業員数合計は、2281万4375人、女性従業者合計は1799万8390任です。
久しぶりにクロス表を作ってカイ二乗検定をしてみましょう。
prop.table関数で比率で表示しました。2012年は女性比率は43.1%で、2016年は44.1%と1%増加しています。たかが1%、されど1%、果たしてこのクロス表で2012年と216年の男女比率に違いはあるでしょうか?chisq.test関数を使います。
p-value < 2.2e-16 < 0.05 ですから、年によって男女比率に違いがある、ということです。2016年のほうが女性従業者比率が高くなったということです。
今回は以上です。
次回は
です。