今回は都道府県別の消費者物価指数、その中の教養娯楽のデータを分析してみます。
政府統計の総合窓口(e-stat)のからデータをダウンロードしました。
www.e-stat.go.jp
まず、都道府県を指定して、
総人口、県内総生産額、消費者物価指数の総合と教養娯楽の4つのデータを選択しました。
このようなCSVファイルをダウンロードしました。9行目に私が変数名を付け加えました。
このCSVファイルをR言語に読み込みます。
まず、何かと便利なtidyverseパッケージの読み込みをします。
read_csv関数で読み込んでみます。
skip = で8行を飛ばして、9行目から読み込むように指示しています。
na = でNAとして読み込む文字列を指定しています。
locale = でファイルのエンコーディングをUTF-8だと指示しています。
str関数でデータが読み込まれているのか確認します。
あれれ。yearとprefこれは調査年と都道府県名なのですが文字化けしていますね。。
なんでかな?
CSVファイルをUTF-8で保存したんですけどね。。
CSV(コンマ区切り)で保存してみます。
再度read_csv関数で読み込んでみたのですがダメです。。
UTF-8で保存しなおして、read.csv関数で読み込んでみます。
う~ん。だめです。。。
しょうがないのでこのように、CSVファイルのほうを直しました。
これで読み込んでみます。
無事に読み込むことができました。
今回は以上です。
次回は
です。