の続きです。
今回は、R言語のlm関数で線形回帰分析をします。
Response variableがHPI:Happy Planet Index
Explanatory variablesがALE:Average Life Expectancy, AWB:Average Well-Being, IOO:Inequality of Outcomes, FTP:Ecological Foot Print , Regi:Regionでやってみます。

ALEが高いほど、AWBが高いほど、IOOが低いほど、FTPが低いほどHPIは高くなることがわかります。
地域でいうと、SSA, Sub-Saharan Africaが有意に低いです。
IOOのPr(>|t|)が0.05よりも高いので、削除してみましょう。

update関数でこのようにIOOを削除します。
anova関数でmodel1とmodel2を比較します。

Pr(>F)が0.05よりも大きいのでmodel1とmodl2で有意な違いはありません。
model2を見てみます。

Regiも削除したらどうなりますか見てみましょう。

update関数で削除しました。
anova関数でmodel2とmodel3を比較します。

Pr(>F)が0.05よりも小さいです。model2とmodel3では有意な違いがあります。Regiは削除しないほうがいいようですね。
model2の残差プロットを見てみます。


73番がとびぬけて外れていますね。どこの国でしょうか?

ルクセンブルグでした。
model2で計算されるルクセンブルグのHPIを見てみます。
predict関数を使います。

model2から計算されるルクセンブルグのHPIは-1.9でした。
今回は以上です。