Bing Image Creator で生成: Close up of carnation flowers, blue sky and great river background, photo
の続きです。
前回はデータフレームを並び替えて、どこの都道府県が老年化指数が高いか、低いか、県内総生産額対前年増加率が高いか、低いかを調べました。
今回はデータをグラフにしてデータの分布の様子などを視覚化してみます。
はじめに elder_index: 老年化指数のヒストグラムを描いてみます。
2012年度と2019年度のヒストグラムを見比べるとよくわかりますが、老年化指数は年を経るにつれて、右側にシフト、つまり値が大きく、つまり老年化していることがわかります。facet_wrap() 関数で年ごとのヒストグラムを描いています。
次は gdp_growth: 県内総生産額対前年増加率の箱ひげ図を描いてみましょう。
geom_boxplot() 関数で箱ひげ図を描いてから、geom_point() 関数で個々の都道府県のデータをプロットしています。
2012年度や、2019年度は低調でした。
次は、elder_index: 老齢化指数と gdp_growth: 県内総生産額対前年増加率の散布図を描いてみます。
geom_smooth() 関数で回帰直線を重ねてみました。2019年度を除くと、elder_index: 老齢化指数の高いところほど、gdp_growth: 県内総生産額対前年増加率は低い傾向がわずかにあるようです。
今回はグラフでデータを視覚化しました。
次回は
です。
初めから読むには、
です。
今回のコードは以下になります。
#
# elder_index: 老年化指数のヒストグラム
df |>
ggplot(aes(x = elder_index, fill = year)) +
geom_histogram(bins = 10, color = "black") +
facet_wrap(~ year) +
theme(legend.position = "none")
#
# gdp_growth: 県内総生産額対前年増加率の箱ひげ図
df |>
ggplot(aes(x = year, y = gdp_growth)) +
geom_boxplot(aes(group = year, fill = year)) +
geom_point() +
theme(legend.position = "none")
#
# elder_index と gdp_growth の散布図
df |>
ggplot(aes(x = elder_index, y = gdp_growth)) +
geom_point(aes(color = year)) +
geom_smooth(method = "lm", se = FALSE) +
facet_wrap(~ year) +
theme(legend.position = "none")
#