crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

児童扶養手当受給者データの分析2 - 母子家庭と父子家庭の比率に注目。R言語のmutate関数、arrange関数, select関数などを使う。

 

www.crosshyou.info

 の続きです。

今回は、母子家庭の比率と父子家庭の比率に注目してみます。

母子家庭比率は、m_pop / t_pop で、

父子家庭比率は、f_pop / t_pop で計算できます。

mutate関数

母子家庭比率(m_ratio)のヒストグラムを見てみましょう。

ggplot関数+geom_histogram関数

母子家庭比率のヒストグラム

母子家庭比率はほとんどの地域で90%以上ですが、ひとつだけとても低い地域があります。どこでしょうか?arrange関数で小さい順に並び替えます。

arrange関数

select関数でtype, name, m_ratioだけを表示しています。そして、head関数ではじめ6行だけを表示しています。

高知市が一番、母子家庭比率が低いのですね。

母子家庭比率が高い地域はどこでしょうか?

arrange関数

郡山市が一番母子家庭比率の高い地域です。

父子家庭比率についてもヒストグラムを描いてみます。

ggplot関数+geom_histogram関数

父子家庭比率のヒストグラム

父子家庭比率はほとんどが10%以下ですね。

父子家庭比率の高い地域を見てみましょう。高知市、高知県かな?

arrange関数

あ、高知県はありましたが、高知市はありませんね。父子家庭比率が一番高いのは秋田県でした。

反対に父子家庭比率が低い地域はどこでしょうか?

arrange関数

郡山市、ありませんね。一番父子家庭比率が低い地域は岡崎市でした。富山市、川口市と続きます。

今回は以上です。