Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の交際・付き合いの平均時間のデータの分析5 - 気温と日照時間の影響を分析

www.crosshyou.info

の続きです。前回、説明変数にtemp:平均気温とsun:日照時間を加えるのを忘れていましたので、この2つも加えてみます。

tempもsunもp値が0.05よりも小さく、統計学的に有意な変数ですね。tempの符号は正の符号なので、平均気温が上がると、交際・付き合い時間も長くなる、ということですね。sunは負の符号ですね。日照時間が短くなると交際・付き合い時間が長くなるということですね。ちょっと解釈に苦しみます。

pop1:一人当り県内総生産額は有意ではなくなったので、この変数は削除したモデルを推定してみます。

R-squaredは0.5594です。このモデル式で交際・付き合い時間の約56%を説明している、ということですね。このモデルが不均一分散(Heteroskedasticity)かどうかをチェックしましょう。

はじめはグラフでチェックします。

残差の分布を見ると、不均一分散はしていないようです。

lmtestパッケージのbptest()関数で、Breusch-Pagan検定をします。

おやおや、p-valueが0.05よりも小さい値です。ということは等分散性の帰無仮説が棄却され、不均一分散がある、ということですね。

このときは、robust標準誤差で各変数が有意かどうかを確認しなければなりません。

sandwichパッケージとcoeftest()関数を使います。

p値が0.05より大きくなる変数はありませんでした。

それでは、lm_mod3のまとめをします。

male_dummy, mitsudo, temp, sunの条件が同じならば、2006年度は2001年度と比べると5.3分交際・付き合い時間が短いです。2011年度は2001年度と比べると7.1分短いです。

 

他の条件が同じとき、男性のほうが1.7分短いです。ちなみに、男女合わせた交際・付き合い時間の平均値は22分ほどなので、平均値の7.7%ぐらいです。

 

他の条件が同じとき、人口密度が1人/ha高くなると、0.035分、交際・付き合い時間が長くなります。ちなみに、人口密度の最小値は2.471で最大値は94.804ですから差は90以上あります。90人ほど人口密度が高くなると、3.15分ほど長くなります。

 

多の条件が同じとき、気温が1℃上昇すると、0.411分交際・付き合い時間が長くなります。ちなみに気温の最小値は8.0℃で最高値は24.0℃なので、差は16℃あります。気温が16℃上昇すると、6.6分長くなります。

 

多の条件が同じとき、日照時間が1時間長くなると、0.0048分交際・付き合い時間が短くなります。ちなみに日照時間の最短は1465時間、最長時間は2362時間なので、差は897時間です。897時間は4.3分に相当します。

 

こうしてまとめると、人口密度や気温、日照時間と交際・付き合いの平均時間の関連性は統計学的に有意なだけでなく、実際問題でも重要かもしれませんね。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 気温と日照時間も加えたモデル
lm_mod2 <- lm(hour ~ year + male_dummy + mitsudo + pop1 +
                temp + sun, data = df)
summary(lm_mod2)
#
# pop1:一人当り県内総生産額を除いたモデル
lm_mod3 <- update(lm_mod2, ~ . - pop1)
summary(lm_mod3)
#
# lm_mod3がHeteroskedasticityかどうか
# 1. グラフでチェック
plot(lm_mod3, which = 1)
#
# 2. Breusch-Pagan Test
library(lmtest)
bptest(lm_mod3)
#
# robust標準誤差
library(sandwich)
coeftest(lm_mod3, vcov = vcovHC(lm_mod3, type = "HC1"))
#

 

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは、Natural flower garden, there are a lot of beautiful flowers, nobody is there, only blue sky, photo です。