Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の老年化指数と県内総生産額対前年増加率のデータの分析3 - R のグラフでデータを視覚化

Bing Image Creator で生成: Close up of carnation flowers, blue sky and great river background, photo

www.crosshyou.info

の続きです。

前回はデータフレームを並び替えて、どこの都道府県が老年化指数が高いか、低いか、県内総生産額対前年増加率が高いか、低いかを調べました。

今回はデータをグラフにしてデータの分布の様子などを視覚化してみます。

はじめに elder_index: 老年化指数のヒストグラムを描いてみます。

2012年度と2019年度のヒストグラムを見比べるとよくわかりますが、老年化指数は年を経るにつれて、右側にシフト、つまり値が大きく、つまり老年化していることがわかります。facet_wrap() 関数で年ごとのヒストグラムを描いています。

次は gdp_growth: 県内総生産額対前年増加率の箱ひげ図を描いてみましょう。

geom_boxplot() 関数で箱ひげ図を描いてから、geom_point() 関数で個々の都道府県のデータをプロットしています。

2012年度や、2019年度は低調でした。

次は、elder_index: 老齢化指数と gdp_growth: 県内総生産額対前年増加率の散布図を描いてみます。

geom_smooth() 関数で回帰直線を重ねてみました。2019年度を除くと、elder_index: 老齢化指数の高いところほど、gdp_growth: 県内総生産額対前年増加率は低い傾向がわずかにあるようです。

今回はグラフでデータを視覚化しました。

次回は

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# elder_index: 老年化指数のヒストグラム
df |> 
  ggplot(aes(x = elder_index, fill = year)) +
  geom_histogram(bins = 10, color = "black") +
  facet_wrap(~ year) +
  theme(legend.position = "none")
#
# gdp_growth: 県内総生産額対前年増加率の箱ひげ図
df |> 
  ggplot(aes(x = year, y = gdp_growth)) +
  geom_boxplot(aes(group = year, fill = year)) +
  geom_point() +
  theme(legend.position = "none")
#
# elder_index と gdp_growth の散布図
df |> 
  ggplot(aes(x = elder_index, y = gdp_growth)) +
  geom_point(aes(color = year)) +
  geom_smooth(method = "lm", se = FALSE) +
  facet_wrap(~ year) +
  theme(legend.position = "none")
#