crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別・男女別の平均余命のデータの分析2 - 平均余命を人口と面積で回帰分析する。人口の多い都道府県ほど余命の男女差比が小さい。

 

www.crosshyou.info

 の続きです。

今回は、平均余命を人口と面積で回帰分析してみます。

まず、都道府県ごとの人口の平均値、面積の平均値を計算します。

f:id:cross_hyou:20190803153522j:plain

f:id:cross_hyou:20190803153538j:plain

人口は東京都、大阪府、神奈川県が多く、鳥取県、島根県、高知県が少ないです。

面積は北海道、岩手県、福島県が広く、香川県、大阪府、東京都が狭いです。

まずは、plot関数で散布図を描きます。

f:id:cross_hyou:20190803154135j:plain

f:id:cross_hyou:20190803154145j:plain

どちらも関係はなさそうです。人口、面積を対数にしてみましょう。

f:id:cross_hyou:20190803154546j:plain

f:id:cross_hyou:20190803154557j:plain

こちらの散布図のほうが見やすくなりましたね。やっぱり、平均余命と人口や面積は関係ないみたいです。lm関数で回帰分析します。

その前に

f:id:cross_hyou:20190803154902j:plain

と対数に変換しておきました。

男性の平均余命から分析します。

f:id:cross_hyou:20190803155211j:plain

p-valueが0.1609ですから、有意なモデルではないですね。

男性の平均余命と人口や面積は関係ないと言えます。

次は、女性の平均余命で回帰分析します。

f:id:cross_hyou:20190803155543j:plain

p-valueが0.3155ですから、有意なモデルではないです。女性の平均余命も人口・面積とは関係ないですね。

平均余命の男女比との相関を見てみます。散布図を描きましょう。

f:id:cross_hyou:20190803160352j:plain

 

f:id:cross_hyou:20190803160406j:plain


男女比も関係なさそうですね。lm関数で回帰分析します。

f:id:cross_hyou:20190803160657j:plain


お!p-value = 0.02817です!0.05よりも小さいですから統計的には有意なモデルですね。各変数のPr(>|t|)を見ると、I(logP^2)が一番大きいので、これを削除したモデルを調べましょう。

f:id:cross_hyou:20190803161354j:plain

p-vlue = 0.01305とさらに小さい値になりました。I(logA^2)とlogP:logAのPrを比べると、logP:logAの方が大きいので、こっちを削除したmoelr3を調べます。

f:id:cross_hyou:20190803161704j:plain

p-valueが0.01004とさらに小さくなりました。logAとI(logA^2)を比べると、logAのほうがPrの値が大きいので、logAを削除したmodelr4を調べましょう。

f:id:cross_hyou:20190803162006j:plain

p-valueが0.005027とさらに小さくなりました。I(logA^2)のPrは0.38596と有意でないので、I(logA^2)を削除したモデル、logPだけのmodelr5を調べます。

f:id:cross_hyou:20190803162325j:plain

p-valueは0.001617とさらに小さくなりました。logPの係数は0.003593で正の値です。Prは0.00162ですから有意です。

解釈はlogP,つまり人口が多いほど、MFRatioは高いということです。人口の多い県ほど、男性の余命が女性との比較で長くなる、ということですね。

最後に散布図に回帰直線を重ね合わせます。

f:id:cross_hyou:20190803162938j:plain

f:id:cross_hyou:20190803162949j:plain

text関数で都道府県名をプロットしました。

今回は以上です。