Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の所定内給与額のデータの分析5 - R言語で2005年度と2017年度の男女格差を比較する。var.test関数とt.test関数

 

www.crosshyou.info

 の続きです。

今回は2005年度と2017年度の男女格差を比較してみようと思います。

まず、2005年度と2017年度だけのratio: 男女の1日当りの所定内給与額の比率のデータフレームを作ります。

f:id:cross_hyou:20210219193617p:plain

summary関数で概要をみてみます。

f:id:cross_hyou:20210219193725p:plain

2005年度の平均値は1.40なのに対して、2017年度の平均値は1.23と格差が縮小しています。

ggplot2のgeom_histogram関数で分布をみてみます。

f:id:cross_hyou:20210219193928p:plain

f:id:cross_hyou:20210219193945p:plain

あきらかに2017年度のほうが比率が小さいほうに分布していますね。

統計的に有意な違いなのか検定してみます。

まずは分散が同じかどうかをvar.test関数で検定します。

f:id:cross_hyou:20210219194247p:plain

p-valueが0.3と0.05よりも大きいですから、分散が同じ、という帰無仮説を棄却できません。すなわち、分散が同じといってよいです。

分散が同じといってよいので、t.test関数で両者の平均値に違いがあるかどうかを検定します。

f:id:cross_hyou:20210219194533p:plain

p-value < 2e-16と0.05よりも小さいです。「平均値が同じ」、という帰無仮説を棄却して、平均値が同じでないとわかりました。

2005年度から20017年度のあいだの12年間で男女格差は縮小したことがわかります。

今回は以上です。

次回は、

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。