Bing Image Creator で生成: Close-up of Lotus Flower on the still lake surface, background is blue sky, rising sun, white clouds, photo
今回は、東京都の大型小売店販売額のデータを分析してみたいと思います。
https://www.toukei.metro.tokyo.lg.jp/tnenkan/2022/tn22q3i012.htm
令和4年の百貨店、スーパーのデータと
https://www.toukei.metro.tokyo.lg.jp/tnenkan/2018/tn18q3i012.htm
平成30年の百貨店、スーパーのデータを使います。
ダウンロードしたCSVファイルを加工して、上のようなファイルにしました。
これらのCSVファイルをダウンロードします。
その前にtidyverseパッケージの読み込みをしておきます。
read_csv()関数で読み込んでいきます。
これら4つのデータフレームをrbind()関数で一つにします。
type, year, monthはファクター型に変換します。
summary()関数でこのデータフレームのサマリーをみてみます。
どの変数も欠損値は無いことが確認できました。
それぞれの変数の定義を確認しておきます。
type: depaならデパート、supeならスーパー
Year: 2018年 or 2022年
month: 月次
stores: 店舗数
days: 営業日数 (日)
persons: 従業者数 (人)
areas: 売場面積(1000m2)
total: 販売額/総額
mclo: 販売額/紳士服・洋品
fclo: 販売額/婦人・子供服・洋品
oclo: 販売額/その他の衣料品
acce: 販売額/身の回り品
food: 販売額/飲食料品
furn: 販売額/家具
elec: 販売額/家庭用電気機械器具
goods: 販売額/家庭用品
other:s 販売額/その他の商品
rest: 販売額/食堂・喫茶
gift: 商品券
です。
金額は百万円単位です。
今回は以上です。
次回は、
です。
今回のコードは以下になります。
#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# 令和4年(2022年)のデパート
df_r4depa <- read_csv("r4_depa.csv", skip = 2)
#
# 令和4年(2022年)のスーパー
df_r4supe <- read_csv("r4_supe.csv", skip = 2)
#
# 平成30年(2018年)のデパート
df_h30depa <- read_csv("h30_depa.csv", skip = 2)
#
# 平成30年(2018年)のスーパー
df_h30supe <- read_csv("h30_supe.csv", skip = 2)
#
# 4つのデータフレームを一つにする
df <- rbind(df_r4depa, df_r4supe, df_h30depa, df_h30supe)
df
#
# type, year, monthをファクター型の変数にする
df <- df |>
mutate(type = as_factor(type),
year = as_factor(year),
month = as_factor(month)
)
#
# サマリー
summary(df)
#