washdata.orgのデータ分析４ - R言語のlm関数で回帰分析。

www.crosshyou.info

の続きです。

今回は、普通にlm関数を使って回帰分析をしてみます。

lm関数で回帰分析

p-value < 2.23-16と0.05よりも小さいので有意なモデルです。urban_rate:year2009とurban_rate:year2017は必要ないようです。update関数で削除します。

update関数とanova関数

update関数で、urban_rate:yearの交互作用の項を削除して、anova関数でlm1とlm2を比較しています。Pr(>F)が0.3437と0.05よりも大きいので、lm1とlm2では有意な違いはありません。なので、より単純なモデルのlm2を採用します。

summary関数でlm2を見てみます。

summary関数

year2009の係数は3.46070で、標準誤差が1.78016ですのでyear2009の信頼区間は、3.46070-1.78016=1.68054 から3.46070+1.78016=5.24086の間です。これはyear2017の係数の4.44017とかぶります。つまり、year2009とyear2017は有意な差が無いということですね。

なので、yearを2000と2000以外の2つのファクターに分けて回帰分析モデルを作ります。

levels関数