の続きです。
今回は2005年度と2017年度の男女格差を比較してみようと思います。
まず、2005年度と2017年度だけのratio: 男女の1日当りの所定内給与額の比率のデータフレームを作ります。
summary関数で概要をみてみます。
2005年度の平均値は1.40なのに対して、2017年度の平均値は1.23と格差が縮小しています。
ggplot2のgeom_histogram関数で分布をみてみます。
あきらかに2017年度のほうが比率が小さいほうに分布していますね。
統計的に有意な違いなのか検定してみます。
まずは分散が同じかどうかをvar.test関数で検定します。
p-valueが0.3と0.05よりも大きいですから、分散が同じ、という帰無仮説を棄却できません。すなわち、分散が同じといってよいです。
分散が同じといってよいので、t.test関数で両者の平均値に違いがあるかどうかを検定します。
p-value < 2e-16と0.05よりも小さいです。「平均値が同じ」、という帰無仮説を棄却して、平均値が同じでないとわかりました。
2005年度から20017年度のあいだの12年間で男女格差は縮小したことがわかります。
今回は以上です。
次回は、
です。
はじめから読むには、
です。