crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

小売物価統計調査のデータ分析1 - R言語にデータを読み込む。

f:id:cross_hyou:20220402084048j:plain

Photo by Masaaki Komori on Unsplash 

f:id:cross_hyou:20220402083849p:plain

久しぶりに政府統計の総合窓口(e-stat)のウェブサイトを閲覧したら、小売り物価統計調査のデータベースが更新されているようです。今回はこのデータを分析してみます。

f:id:cross_hyou:20220402084307p:plain

構造編というデータベースが更新されたようです。

f:id:cross_hyou:20220402084451p:plain

一番上の10大消費目別地域差指数(全国平均=100)  全国、地方、都道府県、都道府県庁所在市及び政令指定都市(2013年~) というデータが更新されたようです。

f:id:cross_hyou:20220402084846p:plain

このようなデータでした。これをダウンロードします。

f:id:cross_hyou:20220402095049p:plain

このようなCSVファイルをダウンロードしました。地域を日本語から英語に変更して、時間軸(年)を数字だけにして、8行目に変数名を入れました。また、政令指定都市などのデータは総合、食料、家賃の値しかなくて、光熱費などデータがなかったので削除しました。

これをR言語に読み込みます。read.csv()関数を使いました。

f:id:cross_hyou:20220402102757p:plain

str()関数でデータの確認をしました。無事に読み込みできました。

ここで、各変数を確認しておきます。

year: 調査年

chiiki: 地域、都道府県名

sougou: 総合

food: 食料

house: 住居

utility: 光熱・水道

kagu: 家具・家事用品

fuku: 被服及び履物

iryou: 保険医療

com: 交通・通信

educ: 教育

culture: 教養娯楽

other: 諸雑費

exrent: (参考)家賃を除く総合

です。

summary()関数で各変数の最小値、最大値、平均値、中央値を見てみます。

f:id:cross_hyou:20220402103712p:plain

utilityの平均値は10.20で一番大きいようです。

今回は以上です。

次回は

www.crosshyou.info

です。