Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の大型小売店販売額のデータの分析 3 - 百貨店とスーパーの違いがはっきりわかるRのバーチャート

Bing Image Creator で生成: Close up photograph of yellow Dandelion flowers, background is long wide view of blue sky and high mountains, photo

www.crosshyou.info

の続きです。

今回は、Rでバーチャートを描いて、百貨店とスーパーの違いがはっきりわかるようにします。

百貨店は販売額は2018年から2022年にかけて現象していました。スーパーは逆に増加していました。そこで、この2018年と2022年の増減を算出してみましょう。

pivot_wider() 関数と mutate() 関数を使って、2022年と2018年の変化幅を表示するデータフレームを作成しました。

これをグラフにします。 geom_bar() 関数でバーチャートを作ります。

百貨店は1月から12月、すべての月で減少しています。スーパーは増加しています。

従業員一人当りの売上高でもみてみましょう。

mutate() 関数で従業員一人当りの売上高を作りました。persales という名前の変数です。百貨店はだいたい800万円ぐらいですね。

百貨店、スーパーでわけて平均値を計算します。

百貨店は814万円、スーパーは281万円が平均です。

これをグラフにしてみます。

百貨店のほうが常にスーパーを上回っていることがわかります。

同じ大型小売店でも百貨店とスーパーでは全く違うことがよくわかりました。

今回は以上です。

次回は

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 2018年と2022年の販売額を比較
df2 <- df |> 
  select(type, year, month, total) |> 
  pivot_wider(names_from = year,
              values_from = total) |> 
  rename(Y2022 = `2022`,
         Y2018 = `2018`) |> 
  mutate(diff = Y2022 - Y2018)
df2
#
# diffのグラフ
df2 |> 
  ggplot(aes(x = month, y = diff)) +
  geom_col(aes(fill = type))
#
#
# 従業員一人当りの売上高
df3 <- df |> 
  select(t,type, year, month, total, persons) |> 
  mutate(persales = total / persons)
df3
#
# 百貨店とスーパーの比較
df3 |> 
  group_by(type) |> 
  summarize(average = mean(persales))
#
# グラフで表示
df3 |> 
  ggplot(aes(x = t, y = persales)) +
  geom_col(aes(fill = type), position = "dodge")
#