UnsplashのBoris Smokrovicが撮影した写真
の続きです。
今回はR言語で回帰分析をしてみます。
被説明変数は、wear_shoe: 被服及び履物費です。回帰分析をはじめる前にwear_shoeとその他の説明変数の候補との相関関係を確認しておきましょう。
一番相関係数が大きいのは、percapita23: 一人当たりの県民所得(平成23年基準)ですね。
これらの散布図も描いてみます。
まずは、上のようにそれぞれの散布図をオブジェクトとして保存しておきます。
そして、gridExtraパッケージのgrid.arrange()関数をつかって9つの散布図を同時に表示します。
こうやって散布図にすると、wear_shoeとの関係性がよくわかりますね。
wariai: 15~64歳の人口割合、を説明変数にして回帰分析してみます。説明変数が一つなので、単回帰分析です。
lm()関数で回帰分析のオブジェクトを作ります。
回帰分析の結果を見るのに、通常はsummary()関数を使いますが、今回はmoderndiveパッケージのget_regression_table()関数を使います。
式で表すと、
wear_shoe = -3283 + 264 * wariai + u
となります。wariaiが1増えると264だけwear_shoeが増えるという式です。
wear_shoeとwariaiの散布図に回帰直線と重ねてみます。
geom_abline()関数で直線を引きました。
lm_wariai$coefficient[1] で切片、lm_wariai$coefficient[2]で傾きを取り出せます。
今回は以上です。
次回は、
です。
はじめから読むには、
です。