www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のバスのデータの分析６ - バス会社の数を人口や県内総生産額などで回帰分析する

データ分析

f:id:cross_hyou:20210717081434j:plain

Photo by MusicFox Fx on Unsplash

www.crosshyou.info

前回は差分でバス会社の数と人口や県内総生産額の回帰分析をしました。人口が10万増加すると、バス会社が8社増えるという関係でした。なんかそんなに増えるのか！という感じがします。

今回はもともとのデータで回帰分析してみます。

まずは、必要なデータの散布図を見てみます。

f:id:cross_hyou:20210717081850p:plain

f:id:cross_hyou:20210717081900p:plain

対数をとって散布図をみてみます。

f:id:cross_hyou:20210717082155p:plain

f:id:cross_hyou:20210717082206p:plain

対数変換したほうがわかりやすい散布図になっているようにみえます。

相関係数もみてみます。

f:id:cross_hyou:20210717082538p:plain

対数変換したほうが相関係数が大きな値ですね。

対数変換した値で回帰分析してみます。

f:id:cross_hyou:20210717082958p:plain

f:id:cross_hyou:20210717083012p:plain

log(pop)の係数は0.70913で1%水準以下で有意です。log(pop)は有意ではないです。

log(pop)とlog(gdp)は相関が非常に高かったので、log(pop)を外したモデルもみてみます。

f:id:cross_hyou:20210717083439p:plain

log(pop)の係数は0.73323と少し大きくなりました。1%以下の水準で有意なのはかわらないです。

人口が1%増えるとバス会社は0.7%ぐらい増加する、ということです。

残差プロットをみてみます。

f:id:cross_hyou:20210717083812p:plain

f:id:cross_hyou:20210717083823p:plain

誤差項の分散が均一なのかBreush-Pegan Testをしてみます。

f:id:cross_hyou:20210717084052p:plain

p-valueが0.001655と0.05よりも小さいですから、誤差項の分散が不均一分散(Heteroskedasticity)ということです。

heteroskedasticity-robust standard errorを計算します。

carパッケージの読み込みが必要です。

f:id:cross_hyou:20210717084559p:plain

lmtestパッケージのcoeftest関数を使います。

f:id:cross_hyou:20210717084906p:plain

log(pop)は1%以下の水準で有意なのはかわらないですね。

今回は

Using R for Introductory Econometrics

Using R for Introductory Econometrics

作者:Heiss, Florian
Independently Published

を参考にしました。

今回は以上です。

はじめから読むには、

www.crosshyou.info

です。