児童扶養手当受給者データの分析４ - R言語でカイ２乗検定。母子家庭比率及び父子家庭比率は地域によって違うのか？

の続きです。

今回はR言語でカイ２乗検定をしてみます。

まずは、クロス表を作成します。

summarise関数

こうして作成したm_tblはtibbleオブジェクトです。このうち、1列目はいらないので、削除します。

rownames関数

m_tbl[ , -1]で1列目を削除して、as.matrix関数でマトリックス型オブジェクトに変換しました。そして、rownames関数で行名を設定しました。

これで終わりではないです。prefの値は、cityとlargeの受給者数も入っていますから、それを引かないといけないです。

マトリックスの計算

比率でも表示してみましょう。rowSums関数を使うと各行の合計が計算できます。

rowSums関数

prefのm_pop比率は88%と低いことがわかります。

それでは、chisq.test関数でカイ２乗検定をしてみます。

chisq.test関数

p-value < 2.2e-16と0.05よりも小さいですから、地域によって母子家庭世帯の受給者数は違いがある、ということですね。

chi_m_tbl$stdresとして調整済残差を見てみましょう。

$stdres 調整済残差

やはり、pref, この場合は政令指定都市と中核都市以外の地域、は母子家庭世帯の受給者数の比率が少ないことがわかります。

同じように父子家庭世帯についても調べましょう。

地域別の父子家庭世帯の受給者数

rowSums関数を利用して比率で表示しましょう。

地域別の父子家庭世帯の受給者数の比率

prefの比率が8.8%とcity, largeと比べて倍ちかくあります。

カイ２乗検定をしてみましょう。

chisq.test関数

p-value < 2.2e-16 ですから有意です。

調整済残差を見ます。

$stdres 調整済残差

やはり、prefで父子家庭世帯の受給者数の比率は高いです。

今回は以上です。