Bing Image Creator で生成: Close up of daisy flowers, ground is green grass, background is blue sky, photo
の続きです。
今回は百貨店とスーパーの売上品目の構成比率をみてみます。
上のようにして、構成比率を計算しました。
このデータを pivot_longer() 関数で分析しやすいようにします。
例えば、2022年1月の百貨店の紳士服の売上高の割合は7.68%,
婦人服の割合は18.8%です。
まず、typeとitemでratioの平均値を計算します。
スーパーは圧倒的に食料品の割合が大きいことがわかります。
百貨店は食料品、その他、婦人服、アクセサリーが大きいです。
食料品の割合の推移を見てみます。
スーパーは、2018年と比較して、2022年のほうが割合が高くなっていることがわかります。
百貨店は、12月が他の月よりも割合が高いことがわかります。
今回は以上です。
初めから読むには、
です。
今回のコードは以下になります。
#
# 品目の割合を計算
df <- df |>
mutate(
r_mclo = mclo / total * 100,
r_fclo = fclo / total * 100,
r_oclo = oclo / total * 100,
r_acce = acce / total * 100,
r_food = food / total * 100,
r_furn = furn / total * 100,
r_elec = elec / total * 100,
r_goods = goods / total * 100,
r_others = others / total * 100,
r_rest = rest / total * 100,
r_gift = gift / total * 100
)
#
# 分析用のデータフレームを作成
df4 <- df |>
select(t, type, year, month, r_mclo:r_gift) |>
pivot_longer(
cols = starts_with("r_"),
names_to = "item",
values_to = "ratio"
)
df4
#
# 百貨店、スーパーのアイテム別の平均構成比率
df4 |>
group_by(type, item) |>
summarize(avg_ratio = mean(ratio)) |>
ggplot(aes(x = item, y = avg_ratio)) +
geom_col(aes(fill = type), position = "dodge")
#
# 食料品の割合の推移
df4 |>
filter(item == "r_food") |>
ggplot(aes(x = t, y = ratio)) +
geom_line(aes(color = type))
#