の続きです。
前回の回帰分析で1人当たりの県内総生産額が大きいほど1住宅当たり延べ面積が広いことがわかりました。
今回は、前回調査の1住宅当たり延べ面積のデータを説明変数に加えても1人当りの県内総生産額が有意な説明変数なのかどうかを検証してみます。
調査年度は、2003年、2008年、2013年です。なので、2003年と2008年の都道府県と1住宅当たり延べ面積のデータフレームを作ります。
filter関数でyear: 調査年度が2003と2008だけに絞り込み、
select関数でyear, pref: 都道府県名、nobe: 1住宅当たり延べ面積(m2)だけにして
mutate関数でyearに5を足して対応する調査年度をあわせます。
rename関数でnobeをnobe_prevと名前を変更しました。前回調査のnobeという意味です。
次に2008年と2013年調査だけのデータフレームを作ります。
こうして作成したdf2003_2008とdf2008_2013をinner_join関数でyearとprefで結合します。
これで回帰分析用のデータフレームができました。
lm関数で回帰分析してみましょう。
p-valueは2.2e-16よりも小さいので有意なモデルです。有意な説明変数はyearとnobe_prevだけでmitsudo: 1ha当たり人口, per_capita17: 1人当たり県内総生産額(平成17年基準【百万円】), per_setai: 1世帯当たり人数 の各変数は有意ではなくなりました。
今回は以上です。
はじめから読むには、
です。