Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の婚姻件数と離婚件数のデータの分析5 - 離婚レシオは上昇傾向だが、西日本のほうが高いことは変化なし。

f:id:cross_hyou:20211016170411j:plain

Photo by James Wheeler on Unsplash 

www.crosshyou.info

の続きです。

いままでは2001年度だけのデータで分析して、西日本のほうが離婚レシオが高いとわかりました。

今回は違う年度でもそうなのか調べてみます。

まず、marとdivのデータがある行だけのデータフレームを作ります。

f:id:cross_hyou:20211016171216p:plain

年度はどのくらいあるのか見てみます。

f:id:cross_hyou:20211016171552p:plain

あらら。「年度」が文字化けというか\u5e74\u5ea6になっていますね。

でも1975年から2019年まであるということがわかります。

どりあえず、df_mardivとpref_codeを合体させます。

f:id:cross_hyou:20211016172100p:plain

うまく合体できました。

次に以下の作業をしてdf_mardivを加工します。まず、year_codeを削除します。そして、yearを始めの4文字だけにします。そしてdiv_mar: div/(mar + div): 離婚レシオを計算します。

f:id:cross_hyou:20211016172612p:plain

それでは、まずは1975年の離婚レシオを各都道府県で見てみましょう。

f:id:cross_hyou:20211016173040p:plain

f:id:cross_hyou:20211016173113p:plain

1975年度も西日本のほうが離婚レシオは高いようです。

t検定をしてみます。

f:id:cross_hyou:20211016173501p:plain

p-valueは0.02643と0.05%よりも小さいので有意な違いがあります。

東日本の平均値は10.5%で西日本の平均値は11.8%です。

2019年度もみてみます。

f:id:cross_hyou:20211016173911p:plain

f:id:cross_hyou:20211016173924p:plain

2019年度も西日本のほうが離婚レシオは高い傾向にあるようです。

t検定で確認します。

f:id:cross_hyou:20211016174248p:plain

p-value = 0.01188と0.05よりも低いp値です。東日本と西日本で離婚レシオには有意な違いがあります。東日本の平均値は26.3%で西日本の平均値は27.9%です。

1975年度と比較すると、15ポイントぐらい高くなっていますね。

全国の離婚レシオの経年変化を見てみます。

f:id:cross_hyou:20211016175312p:plain

離婚レシオのピークは2001年、2002年くらいですかね。

傾向としては上昇傾向ですね。

今回は以上です。

次回は、

 

www.crosshyou.info

です。

初めから読むには、

 

www.crosshyou.info

です。