都道府県別の共働き世帯割合のデータの分析４ - R言語で重回帰分析をする。Breush-Pagan検定やWhite検定のspecial formで均一分散の検定をする。

f:id:cross_hyou:20211211081612j:plain

の続きです。

前回は、tomo: 共働き世帯割合(%)をunem: 完全失業率(%)で回帰分析してみました。

2015年だけのデータを使うと、

tomo = 51.19 - 16.66 x log(unem) + u

というモデルが推計されました。

失業率が1%上昇すると、0.16ポイント共働き世帯割合が下がるという関係がわかりました。

今回は、他の変数、

consr: 人口集中地区面積比率(%)
consn: 人口集中地区の人口密度(人/km^2)
ggdp23: 県内総生産額対前年増加率(平成23年基準)(%)
r1: 第1次産業就業者比率(%)
r2: 第2次産業就業者比率(%)

これらの変数を加えてみて、log(unem)の係数がどうなるかをみてみましょう。

2015年のデータだけで回帰分析をしてみます。

f:id:cross_hyou:20211211082426p:plain

log(unem)の係数は、-1.028e+01となっています。これは、-10.28ということです。

t値は-4.598ですからp値は0.1%以下ということで、ほとんど確実にunem: 完全失業率は共働き世帯割合に影響していることがわかります。

第2次産業就業者比率やその他の変数の条件が一定のとき、完全失業率が1%上昇すると(例えば4%だったのが4.04%に上昇)、共働き世帯割合が0.1ポイント低下する、ということですね。

残差プロットをみてみましょう。

f:id:cross_hyou:20211211083311p:plain

f:id:cross_hyou:20211211083341p:plain

どうなんでしょうか？残差は均一分散といえるのでしょうか？

Breusch-Pagan検定をしてみましょう。

lmtestパッケージを読み込みして、bptest()関数を使います。

f:id:cross_hyou:20211211083756p:plain

p-valueが0.3397と0.05よりも大きいので、H0: 残差が均一分散しているという帰無仮説を棄却することはできません。つまり、残差は均一分散しているということです。

bptest()関数を使わない方法もやってみます。

f:id:cross_hyou:20211211084331p:plain

残差の2乗を回帰分析したモデルを考えます。どの変数の係数のp値も0.05より大きく、モデル全体のp値は0.364です。同じように、H0: 残差が均一分散という帰無仮説は棄却できないです。

もうひとつ、均一分散の検定で、White検定のspecial formでやってみます。

f:id:cross_hyou:20211211084840p:plain

p値は0.376です。

これは残差の2乗を説明変数で回帰するのではなくて、y_hatとy_hatの2乗で回帰分析するものです。

bptest()関数を使わないと以下のようになります。

f:id:cross_hyou:20211211085405p:plain

p値は0.3925ですね。

各都道府県のモデルで推計された共働き世帯割合と実際の共働き世帯割合を比較してみましょう。

f:id:cross_hyou:20211211090746p:plain

f:id:cross_hyou:20211211090759p:plain

赤い点線が45°の線になりますので、この線よりも上の都道府県はモデルの推計値のほうが実際の値よりも大きな都道府県、この線よりも下の都道府県はモデルの推計値のほうが実際の値よりも小さいところとなります。

今回は以上です。

次回は

です。

初めから読むには、

です。