Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

経済センサスの事業所に関する集計データの分析2 - R言語で男女比率が変化したかを検定する

 

www.crosshyou.info

 の続きです。

今回は2012年と2016年で男女比率が変化したかどうかをR言語で調べてみたいと思います。

まず、2012年の男女比率を見てみましょう。

まず、計算に必要なデータを抽出します。

f:id:cross_hyou:20181210215459j:plain

 

計算してみましょう。

f:id:cross_hyou:20181210220034j:plain

 

男女比率の高い順に並び替えましょう。order関数を使います。

f:id:cross_hyou:20181210220251j:plain

 

中京、関東、宇都宮都市圏が男女比率が高い、すなわち男性従業者数が多く、熊本、松山、鹿児島都市圏が男女比率が低い、すなわち女性従業者数が多いことがわかります。

同じようなことを2016年のデータでもやってみましょう。今回はsubset関数で2016年のデータフレームを作成します。

f:id:cross_hyou:20181210221253j:plain

 

男女比率を同じように作成して大きい順に並び替えます

f:id:cross_hyou:20181210221634j:plain

男女比率が高いのは、中京、宇都宮、関東です。低いのは鹿児島、松山、熊本です。

それでは2012年と2016年の変化幅を計算してみます。

f:id:cross_hyou:20181210222523j:plain

 

松山都市圏だけが男女比率が増加しています。13地域が男女比率は減少、1地域が増加です。この割合は統計的に有意でしょうか?増加・減少が50%50%の確率で起こるとして13増加:1減少になる確率はどのくらいでしょうか?dbinom関数で計算してみましょう。

f:id:cross_hyou:20181210223448j:plain

半々の確率で増加または減少になるとき、13増加、1減少になる確率はわずか0.0008544922です。半々の確率ではない、ということですね。

それぞれの年の男性従業者、女性従業者の合計値を算出してみます。

f:id:cross_hyou:20181210224201j:plain

 

2012年の男性従業者数合計は、2253万8237人、女性従業者合計は1707万8321人です。

2016年の男性従業員数合計は、2281万4375人、女性従業者合計は1799万8390任です。

久しぶりにクロス表を作ってカイ二乗検定をしてみましょう。

f:id:cross_hyou:20181210224926j:plain

 

prop.table関数で比率で表示しました。2012年は女性比率は43.1%で、2016年は44.1%と1%増加しています。たかが1%、されど1%、果たしてこのクロス表で2012年と216年の男女比率に違いはあるでしょうか?chisq.test関数を使います。

f:id:cross_hyou:20181210225405j:plain

 

p-value < 2.2e-16 < 0.05 ですから、年によって男女比率に違いがある、ということです。2016年のほうが女性従業者比率が高くなったということです。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。