Photo by MusicFox Fx on Unsplash
前回は差分でバス会社の数と人口や県内総生産額の回帰分析をしました。人口が10万増加すると、バス会社が8社増えるという関係でした。なんかそんなに増えるのか!という感じがします。
今回はもともとのデータで回帰分析してみます。
まずは、必要なデータの散布図を見てみます。
対数をとって散布図をみてみます。
対数変換したほうがわかりやすい散布図になっているようにみえます。
相関係数もみてみます。
対数変換したほうが相関係数が大きな値ですね。
対数変換した値で回帰分析してみます。
log(pop)の係数は0.70913で1%水準以下で有意です。log(pop)は有意ではないです。
log(pop)とlog(gdp)は相関が非常に高かったので、log(pop)を外したモデルもみてみます。
log(pop)の係数は0.73323と少し大きくなりました。1%以下の水準で有意なのはかわらないです。
人口が1%増えるとバス会社は0.7%ぐらい増加する、ということです。
残差プロットをみてみます。
誤差項の分散が均一なのかBreush-Pegan Testをしてみます。
p-valueが0.001655と0.05よりも小さいですから、誤差項の分散が不均一分散(Heteroskedasticity)ということです。
heteroskedasticity-robust standard errorを計算します。
carパッケージの読み込みが必要です。
lmtestパッケージのcoeftest関数を使います。
log(pop)は1%以下の水準で有意なのはかわらないですね。
今回は
を参考にしました。
今回は以上です。
はじめから読むには、
です。