
の続きです。前回の分析で男女の違いや調査年の違いによって交際・付き合いの平均時間は違うことが確認できました。
今回からはいよいよ人口密度や一人当り県内総生産額が交際・付き合いの平均時間に影響を与えているかをみていきましょう。
まず、人口密度と一人当り県内総生産額の変数を作ります。

男女の違いがありますので、hour_mとhour_fを一つの変数にして、male_dummyという変数でhour_mなら1、hour_fなら0のダミー変数にします。

それでは、lm()関数でOLSでモデルを推定します。
被説明変数は、hour:交際・付き合いの平均時間、説明変数は、year:調査年度、male_dummy:男性なら1のダミー変数、mitsudo:人口密度、pop1:一人当り県内総生産額です。

mitsudoの係数は0.047でプラスの係数、pop1の係数は-0.33でマイナスです。人口密度が高いと交際・付き合いの平均時間は長く、一人当り県内総生産額が大きいと交際・付き合いの平均時間は短くなる、という解釈ですね。
summary()関数で統計学的に有意かどうかを見てみます。

pop1は有意ではありませんが、mitsudoはp値が0.05よりも小さく有意ですね。
mitsudoは、人/haですので、人口密度が1人/ha増えると、交際・付き合いの平均時間は0.047分増える、ということ、わかりやすくすると人口密度が100人/ha増えると4.7分交際・付き合いの平均時間は長くなる、ということですね。男女の違い、調査年度、一人当り県内総生産額が同じとして、人口密度が100人/ha増えると、交際・付き合いの平均時間は4.7分長くなるということです。
人口密度の平均は13.7で、交際・付き合いの平均時間の平均は22.1ということなので、

人口密度は統計学的に有意とはいっても、実際問題としては、あまり影響はない、ということですね。
今回は以上です。
次回は
です。
はじめから読むには、
です。
今回のコードは以下になります。
#
# 人口密度、一人当り県内総生産額を計算
df <- df |>
mutate(
mitsudo = pop / area,
pop1 = gdp / pop
)
df |> select(mitsudo, pop1) |>
summary()
#
# hour_m, hour_fを一つにし、maleというダミー変数を作る
df <- df |>
pivot_longer(
cols = c(hour_m, hour_f),
names_to = "male_dummy",
values_to = "hour"
) |>
mutate(
male_dummy = if_else(male_dummy == "hour_m", 1, 0)
)
df |> select(male_dummy, hour)
#
# モデル推計
lm_mod <- lm(hour ~ year + male_dummy + mitsudo + pop1,
data = df)
lm_mod
#
# モデルのサマリー
summary(lm_mod)
#
# mitsudo, hourの平均値
df |> select(mitsudo, hour) |>
summary()
#
(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは、Landscape of natural ancient grass field, one big tree, close up of red Poinsettia, photo です。)