の続きです。
今回はR言語でカイ2乗検定をしてみます。
まずは、クロス表を作成します。
こうして作成したm_tblはtibbleオブジェクトです。このうち、1列目はいらないので、削除します。
m_tbl[ , -1]で1列目を削除して、as.matrix関数でマトリックス型オブジェクトに変換しました。そして、rownames関数で行名を設定しました。
これで終わりではないです。prefの値は、cityとlargeの受給者数も入っていますから、それを引かないといけないです。
比率でも表示してみましょう。rowSums関数を使うと各行の合計が計算できます。
prefのm_pop比率は88%と低いことがわかります。
それでは、chisq.test関数でカイ2乗検定をしてみます。
p-value < 2.2e-16と0.05よりも小さいですから、地域によって母子家庭世帯の受給者数は違いがある、ということですね。
chi_m_tbl$stdresとして調整済残差を見てみましょう。
やはり、pref, この場合は政令指定都市と中核都市以外の地域、は母子家庭世帯の受給者数の比率が少ないことがわかります。
同じように父子家庭世帯についても調べましょう。
rowSums関数を利用して比率で表示しましょう。
prefの比率が8.8%とcity, largeと比べて倍ちかくあります。
カイ2乗検定をしてみましょう。
p-value < 2.2e-16 ですから有意です。
調整済残差を見ます。
やはり、prefで父子家庭世帯の受給者数の比率は高いです。
今回は以上です。