crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

JFAコンビニエンスストア統計調査月報データの分析1 - R言語で基本統計量を取得

今回は、JFAコンビニエンスストア統計調査のデータを分析したいと思います。

www.jfa-fc.or.jpのウェブページに過去24か月のデータがPDFファイルであります。

f:id:cross_hyou:20190122155429j:plain

このようなPDFファイルです。

この24個のPDFファイルをダウンロードし、CSVファイルにこのように転記しました。

f:id:cross_hyou:20190124184004j:plain



このファイルをR言語に読込ませ、データ分析の練習をしていこうと思います。

まず、read.csv関数でCSVファイルを読み込ませ、summary関数で要約統計量を表示します。

f:id:cross_hyou:20190124184109j:plain


str関数でデータ構造を確認しましょう。

f:id:cross_hyou:20190124184127j:plain



観測値は24個です。2017年の12か月と2018年の12か月合わせて24個の観測値ですね。

変数は13ですが、年と月を除くと11ですね。

全店売上高は単位は100万円です。平均が902589です。つまり9025億8900万円です。

日本全国で1か月コンビニで9000億円の売り上げがあることがわかります。

既存店売上高も単位は100万円です。平均は7999億2500万円です。

全店舗数は単位は1店舗です。平均は55281店舗です。

全店来客数は単位は千人です。平均は1447080ですから、全国で1か月に14億4708万人の来店です。日本の人口って1億2000万人ぐらですかね?そうすると、一人平均で10回ぐらいひと月に来店している計算ですよね。。3日に一回ぐらいですよね。。これってすごくないですか?

既存来店客数の単位も千人です。平均は12億9995万3千人です。

全店客単価の単位は円です。平均は623円80銭です。

既存店客単価の単位も円です。平均は615円50銭です。全店客単価のほうが既存店客単価よりも高いということは、新規店客単価が既存店客単価よりも高いということですね。

日配食品、加工食品、非食品、サービスの単位はパーセント(%)です。売上高に占めるパーセンテージですね。

日配食品の平均は36.52%

加工食品の平均は27.495

非食品の平均は30.42%

サービスの平均は5.571%です。

食品で65%ぐらいを占めることがわかります。

今回は以上です。24個のPDFファイルからデータをCSVファイルにまとめるので疲れました。R言語でもっと簡単にできると思うのですが、まだそこまで習熟していないので手作業でしました。

 次回は

 

www.crosshyou.info

 

です。

 

訂正記録:2019年01月24日:2018年06月の既存店売上高のCSVファイルの数値が間違っていたので訂正しました。