Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の大型小売店販売額のデータの分析4 - R で売上高の構成比率を分析

Bing Image Creator で生成: Close up of daisy flowers, ground is green grass, background is blue sky, photo 

www.crosshyou.info

の続きです。

今回は百貨店とスーパーの売上品目の構成比率をみてみます。

上のようにして、構成比率を計算しました。

このデータを pivot_longer() 関数で分析しやすいようにします。

例えば、2022年1月の百貨店の紳士服の売上高の割合は7.68%,

婦人服の割合は18.8%です。

まず、typeとitemでratioの平均値を計算します。

スーパーは圧倒的に食料品の割合が大きいことがわかります。

百貨店は食料品、その他、婦人服、アクセサリーが大きいです。

食料品の割合の推移を見てみます。

スーパーは、2018年と比較して、2022年のほうが割合が高くなっていることがわかります。

百貨店は、12月が他の月よりも割合が高いことがわかります。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 品目の割合を計算
df <- df |> 
  mutate(
    r_mclo = mclo / total * 100,
    r_fclo = fclo / total * 100,
    r_oclo = oclo / total * 100,
    r_acce = acce / total * 100,
    r_food = food / total * 100,
    r_furn = furn / total * 100,
    r_elec = elec / total * 100,
    r_goods = goods / total * 100,
    r_others = others / total * 100,
    r_rest = rest / total * 100,
    r_gift = gift / total * 100
  )
#
# 分析用のデータフレームを作成
df4 <- df |> 
  select(t, type, year, month, r_mclo:r_gift) |> 
  pivot_longer(
    cols = starts_with("r_"),
    names_to = "item",
    values_to = "ratio"
  )
df4
#
# 百貨店、スーパーのアイテム別の平均構成比率
df4 |> 
  group_by(type, item) |> 
  summarize(avg_ratio = mean(ratio)) |> 
  ggplot(aes(x = item, y = avg_ratio)) + 
  geom_col(aes(fill = type), position = "dodge")
#
# 食料品の割合の推移
df4 |> 
  filter(item == "r_food") |> 
  ggplot(aes(x = t, y = ratio)) +
  geom_line(aes(color = type))
#