www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

Happy Planet Indexのデータ分析7 - R言語のlm関数で回帰分析をする

 

www.crosshyou.info

 の続きです。

今回は、R言語のlm関数で線形回帰分析をします。

Response variableがHPI:Happy Planet Index

Explanatory variablesがALE:Average Life Expectancy, AWB:Average Well-Being, IOO:Inequality of Outcomes, FTP:Ecological Foot Print , Regi:Regionでやってみます。

lm関数

ALEが高いほど、AWBが高いほど、IOOが低いほど、FTPが低いほどHPIは高くなることがわかります。

地域でいうと、SSA, Sub-Saharan Africaが有意に低いです。

IOOのPr(>|t|)が0.05よりも高いので、削除してみましょう。

update関数

update関数でこのようにIOOを削除します。

anova関数でmodel1とmodel2を比較します。

anova関数

Pr(>F)が0.05よりも大きいのでmodel1とmodl2で有意な違いはありません。

model2を見てみます。

summary関数

Regiも削除したらどうなりますか見てみましょう。

update関数

update関数で削除しました。

anova関数でmodel2とmodel3を比較します。

anova関数

Pr(>F)が0.05よりも小さいです。model2とmodel3では有意な違いがあります。Regiは削除しないほうがいいようですね。

model2の残差プロットを見てみます。

残差プロット

残差プロット

73番がとびぬけて外れていますね。どこの国でしょうか?

73番の国

ルクセンブルグでした。

model2で計算されるルクセンブルグのHPIを見てみます。

predict関数を使います。

predict関数

model2から計算されるルクセンブルグのHPIは-1.9でした。

今回は以上です。