(Bing Image Creator で生成: Close up of Primula Polyanthus flowers, background is sand land, blue sky, photo)
の続きです。
今回は2つの変数の散布図を描いてみます。
まず、自殺者数と総所得増加率を散布図にします。
人口密度と総所得増加率が揃っているのは、2005年度と2010年度だけです。
geom_smooth() で回帰線も追加してみました。2005年と2010年では全く傾きが違います。
次は、人口密度と自殺者数です。
どの年度も傾きはマイナス、つまり、人口密度の多いところほど自殺者数が少ないということですね。
次は、自殺者数と総所得増加率です。
回帰線の傾きはマイナスの年度もあれば、プラスの年度もありますね。
自殺者数を年度、人口密度、総所得増加率で回帰分析してみます。
year: 年度は2005年度と2010年度しかありませんが、年度による統計的に有意な違いはないようです。
mitsudo: 人口密度の係数はマイナスです。p値は 0.05 以下なので統計的に有意です。
人口密度が高いほど、自殺者数は少ないということです。
growth: 総所得増加率の係数はマイナスです。p値は 0.05 以下なので統計的に有意です。総所得増加率が大きいほど、自殺者数が少ないということです。
自殺者数は、人口密度が高くて、総所得増加率が大きいほど少ないということですね。
人がいっぱいいて、所得の伸びがおおきいところほど自殺者数は少ないということですね。これは、直感と反する結果ではありませんね。
今回は以上です。
次回は
です。
初めから読むには、
です。
今回のコードは以下になります。
# 人口密度と所得対前年比(mitsudo, growth) の散布図
df_raw |>
filter(!is.na(mitsudo) & !is.na(growth)) |>
ggplot(aes(x = mitsudo, y = growth, color = year)) +
geom_point(size = 2) +
geom_smooth(method = "lm", se = FALSE)
#
# 人口密度と自殺者数(mitsudo, jisatsu) の散布図
df_raw |>
filter(!is.na(mitsudo) & !is.na(jisatsu)) |>
ggplot(aes(x = mitsudo, y = jisatsu, color = year)) +
geom_point(size = 2) +
geom_smooth(method = "lm", se = FALSE)
#
# 所得対前年比と自殺者数(growth, jisatsu) の散布図
df_raw |>
filter(!is.na(growth) & !is.na(jisatsu)) |>
ggplot(aes(x = growth, y = jisatsu, color = year)) +
geom_point(size = 2) +
geom_smooth(method = "lm", se = FALSE)
#
# 自殺者数を年度、人口密度、総所得増加率で回帰分析
lm_mod1 <- lm(jisatsu ~ year + mitsudo + growth,
data = df_raw)
summary(lm_mod1)
#