crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

児童扶養手当受給者データの分析3 - 地域のタイプ別に母子家庭比率、父子家庭比率を見てみる。

 

www.crosshyou.info

の続きです。

前回の分析で、母子家庭比率、父子家庭比率は地域のタイプ(都道府県、指定都市、中核都市)によって違いがありそうだとわかりました。

グラフにして確かめてみます。

まずは、地域タイプ別の箱ひげ図を作成してみました。

ggplot関数+geom_boxplot関数

地域タイプ別の母子家庭比率

largeというのは政令指定都市です。cityは中核都市、prefは都道府県です。都道府県は母子家庭比率が低いように見えますね。

父子家庭比率も同じように見てます。

ggplot関数+geom_boxplot関数

地域タイプ別の父子家庭比率

父子家庭比率は都道府県が比率が高いようです。

group_by関数とsummarise関数をつかって集計してみます。

group_by関数とsummarise関数

母子家庭比率の平均値は政令指定都市(large)が92.6%で一番高く、

父子家庭比率の平均値は都道府県(pref)が6.12%と一番高いです。

でも、これは、各都道府県や政令指定都市、中核都市の比率の平均値ですから、正確な値ではありません。

正確な比率は、

都道府県の合計の母子家庭世帯の受給者数 / 都道府県の合計の総受給者数

で計算しないといけないです。

計算してみましょう。

group_by関数とsummarise関数

母子家庭比率は、政令指定都市(large)が92.8%で一番高く、

父子家庭比率は、都道府県(pref)が5.65%で一番高いです。

念のため検算してみましょう。

Rで算術計算

あっていますね。

今回は以上です。