Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の商業動態統計調査のデータの分析2 - Rでヒストグラムや箱ひげ図、散布図を描く。

www.crosshyou.info

の続きです。前回はCSVファイルのデータをRに読み込ませました。今回はデータをグラフにしてみます。私が特に興味を持っているのは百貨店・スーパーの販売額の前年比です。まずは、ヒストグラムにしてデータの分布を見てみます。

前年比がプラスのデータのほうが多いようですね。

次は2021年度、2022年度、2023年度の年度別の箱ひげ図をみてみます。

2021年度と比較すると、2022年度、20223年度は前年比が増えていることがわかりますね。

2021年度の前年比と2023年度の前年比の散布図を描いてみます。

geom_abline()関数で切片が0、傾きが1の赤い線を引いてあります。この赤い線よりも下にある都道府県は、2021年度のほうが2023年度よりも前年比が高かったところです。福井県と島根県がそうですね。2021年度では東京都が一番前年比が高く、2023年度では大阪府が一番前年比が高いことがわかります。グラフの右上に位置している都道府県は2021年度、2023年度の前年比が高いところですね。大阪府、福岡県、京都府、東京都、沖縄県などは百貨店・スーパーの販売額が好調に伸びていたことがわかります。

今回の分析では、年度が違うと前年比の伸びが違うことがわかりました。

今回は以上です。

次回は

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 百貨店・スーパーの前年比のヒストグラム
df |> 
  filter(shop == "super_and_depart") |> 
  ggplot(aes(x = yoy)) +
  geom_histogram(binwidth = 1.0, color = "white", boundary = 0) +
  geom_vline(xintercept = 0, color = "red") +
  theme_minimal()
#
# 年度別の箱ひげ図
df |> 
  filter(shop == "super_and_depart") |> 
  ggplot(aes(x = year, y = yoy, group = year)) +
  geom_boxplot(aes(fill = year)) +
  theme_minimal()
#
# 2021年度と2023年度の散布図
df |> 
  filter(shop == "super_and_depart" &
           year %in% c("2021年度", "2023年度")) |> 
  pivot_wider(names_from = year,
              values_from = yoy) |> 
  ggplot(aes(x = `2021年度`, y = `2023年度`)) +
  geom_point() +
  geom_text(aes(label = pref), vjust = 1.2) +
  geom_abline(color = "red") +
  theme_minimal()
#

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは、Splendid moment landscape of wild green grass fields, flowering yellow beautiful Dandelion flowers, Photo です。)