Photo by James Wheeler on Unsplash
の続きです。
いままでは2001年度だけのデータで分析して、西日本のほうが離婚レシオが高いとわかりました。
今回は違う年度でもそうなのか調べてみます。
まず、marとdivのデータがある行だけのデータフレームを作ります。
年度はどのくらいあるのか見てみます。
あらら。「年度」が文字化けというか\u5e74\u5ea6になっていますね。
でも1975年から2019年まであるということがわかります。
どりあえず、df_mardivとpref_codeを合体させます。
うまく合体できました。
次に以下の作業をしてdf_mardivを加工します。まず、year_codeを削除します。そして、yearを始めの4文字だけにします。そしてdiv_mar: div/(mar + div): 離婚レシオを計算します。
それでは、まずは1975年の離婚レシオを各都道府県で見てみましょう。
1975年度も西日本のほうが離婚レシオは高いようです。
t検定をしてみます。
p-valueは0.02643と0.05%よりも小さいので有意な違いがあります。
東日本の平均値は10.5%で西日本の平均値は11.8%です。
2019年度もみてみます。
2019年度も西日本のほうが離婚レシオは高い傾向にあるようです。
t検定で確認します。
p-value = 0.01188と0.05よりも低いp値です。東日本と西日本で離婚レシオには有意な違いがあります。東日本の平均値は26.3%で西日本の平均値は27.9%です。
1975年度と比較すると、15ポイントぐらい高くなっていますね。
全国の離婚レシオの経年変化を見てみます。
離婚レシオのピークは2001年、2002年くらいですかね。
傾向としては上昇傾向ですね。
今回は以上です。
次回は、
です。
初めから読むには、
です。