Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東京都の大型小売店販売額のデータの分析1 - CSVファイルのデータをRに取り込む。

Bing Image Creator で生成: Close-up of Lotus Flower on the still lake surface, background is blue sky, rising sun, white clouds, photo

今回は、東京都の大型小売店販売額のデータを分析してみたいと思います。

https://www.toukei.metro.tokyo.lg.jp/tnenkan/2022/tn22q3i012.htm

令和4年の百貨店、スーパーのデータと

https://www.toukei.metro.tokyo.lg.jp/tnenkan/2018/tn18q3i012.htm

平成30年の百貨店、スーパーのデータを使います。

ダウンロードしたCSVファイルを加工して、上のようなファイルにしました。

これらのCSVファイルをダウンロードします。

その前にtidyverseパッケージの読み込みをしておきます。

read_csv()関数で読み込んでいきます。

これら4つのデータフレームをrbind()関数で一つにします。

type, year, monthはファクター型に変換します。

summary()関数でこのデータフレームのサマリーをみてみます。

どの変数も欠損値は無いことが確認できました。

それぞれの変数の定義を確認しておきます。

type: depaならデパート、supeならスーパー

Year: 2018年 or 2022年

month: 月次

stores: 店舗数

days: 営業日数 (日)

persons: 従業者数 (人)

areas: 売場面積(1000m2)

total: 販売額/総額

mclo: 販売額/紳士服・洋品

fclo: 販売額/婦人・子供服・洋品

oclo: 販売額/その他の衣料品

acce: 販売額/身の回り品

food: 販売額/飲食料品

furn: 販売額/家具

elec: 販売額/家庭用電気機械器具

goods: 販売額/家庭用品

other:s 販売額/その他の商品

rest: 販売額/食堂・喫茶

gift: 商品券

です。

金額は百万円単位です。

今回は以上です。

次回は、

 

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# 令和4年(2022年)のデパート
df_r4depa <- read_csv("r4_depa.csv", skip = 2)
#
# 令和4年(2022年)のスーパー
df_r4supe <- read_csv("r4_supe.csv", skip = 2)
#
# 平成30年(2018年)のデパート
df_h30depa <- read_csv("h30_depa.csv", skip = 2)
#
# 平成30年(2018年)のスーパー
df_h30supe <- read_csv("h30_supe.csv", skip = 2)
#
# 4つのデータフレームを一つにする
df <- rbind(df_r4depa, df_r4supe, df_h30depa, df_h30supe)
df
#
# type, year, monthをファクター型の変数にする
df <- df |> 
  mutate(type = as_factor(type),
         year = as_factor(year),
         month = as_factor(month)
         )
#
# サマリー
summary(df)
#