crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の生活習慣病による死亡者数のデータ分析4 - 2015年度と2006年度の比較。東京はほとんど変わらず。

 

www.crosshyou.info

 の続きです。

今回は、2015年度と2006年度を比較して、どの都道府県が生活習慣病による死亡者が増えたのか、減ったのかをみてみたいと思います。

まず、2006年度の人口1万人当りの死亡者数を一つのベクトルにしてみます。

tapply関数とmax関数を使いました。

f:id:cross_hyou:20200318191508p:plain

愛知県、愛媛県、茨城県とはじまって、兵庫県、北海道、和歌山県で終わる順番です。

2015年度も同じようにします。

f:id:cross_hyou:20200318191805p:plain

同じように、愛知県、愛媛県、茨城県と始まって兵庫県、北海道、和歌山県と終わりますね。tapply関数で処理すると、ある一定の規則に従って順番が決まるのでしょう。

このDR15-DR06を出せば、都道府県ごとにどれだけ変化したかわかります。

f:id:cross_hyou:20200318192359p:plain

東京都はほとんど変わらないですね。宮崎県、青森県は10人以上増えています。

hist関数でヒストグラムを描きます。

f:id:cross_hyou:20200318192642p:plain

f:id:cross_hyou:20200318192654p:plain

4から6の間が一番頻度が多いですね。

summary関数で平均値などを出しましょう。

f:id:cross_hyou:20200318192842p:plain

平均値は5.08で中央値は4.94です。

前回の分析では、人口1万人当たりの死亡者数は、人口密度の対数と関係があることがわかりました。なので、今回は都道府県別の人口密度の変化を算出して、そのデータと回帰分析してみましょう。

まず、人口密度の変化を表すベクトルを作成します。

f:id:cross_hyou:20200318194127p:plain

秋田県が一番、人口密度が低くなり、東京都が一番高くなりました。

この人口密度の変化(対数)と死亡者数の変化を散布図にしてみます。plot関数です。

f:id:cross_hyou:20200318194447p:plain

f:id:cross_hyou:20200318194432p:plain

人口密度(対数)が増えているほうが、死亡者数は減っているようですね。

lm関数で回帰分析してみます。

f:id:cross_hyou:20200318194711p:plain

p-valueが9.004e-5と0.05よりも小さいので有意なモデルです。

回帰式は、人口1万人当りの死亡者数の変化 = 3.7997 - 33.2367 x 人口密度(対数)の変化

です。やはり、人口密度が高くなった県ほど死亡者数の増加は小さいということですね。

散布図に書き直線を重ねましょう。

f:id:cross_hyou:20200318195159p:plain

f:id:cross_hyou:20200318195210p:plain

今回は以上です。