の続きです。
今回は、平均余命を人口と面積で回帰分析してみます。
まず、都道府県ごとの人口の平均値、面積の平均値を計算します。
人口は東京都、大阪府、神奈川県が多く、鳥取県、島根県、高知県が少ないです。
面積は北海道、岩手県、福島県が広く、香川県、大阪府、東京都が狭いです。
まずは、plot関数で散布図を描きます。
どちらも関係はなさそうです。人口、面積を対数にしてみましょう。
こちらの散布図のほうが見やすくなりましたね。やっぱり、平均余命と人口や面積は関係ないみたいです。lm関数で回帰分析します。
その前に
と対数に変換しておきました。
男性の平均余命から分析します。
p-valueが0.1609ですから、有意なモデルではないですね。
男性の平均余命と人口や面積は関係ないと言えます。
次は、女性の平均余命で回帰分析します。
p-valueが0.3155ですから、有意なモデルではないです。女性の平均余命も人口・面積とは関係ないですね。
平均余命の男女比との相関を見てみます。散布図を描きましょう。
男女比も関係なさそうですね。lm関数で回帰分析します。
お!p-value = 0.02817です!0.05よりも小さいですから統計的には有意なモデルですね。各変数のPr(>|t|)を見ると、I(logP^2)が一番大きいので、これを削除したモデルを調べましょう。
p-vlue = 0.01305とさらに小さい値になりました。I(logA^2)とlogP:logAのPrを比べると、logP:logAの方が大きいので、こっちを削除したmoelr3を調べます。
p-valueが0.01004とさらに小さくなりました。logAとI(logA^2)を比べると、logAのほうがPrの値が大きいので、logAを削除したmodelr4を調べましょう。
p-valueが0.005027とさらに小さくなりました。I(logA^2)のPrは0.38596と有意でないので、I(logA^2)を削除したモデル、logPだけのmodelr5を調べます。
p-valueは0.001617とさらに小さくなりました。logPの係数は0.003593で正の値です。Prは0.00162ですから有意です。
解釈はlogP,つまり人口が多いほど、MFRatioは高いということです。人口の多い県ほど、男性の余命が女性との比較で長くなる、ということですね。
最後に散布図に回帰直線を重ね合わせます。
text関数で都道府県名をプロットしました。
今回は以上です。