crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の消費者物価指数・教養娯楽のデータの分析1 - R言語のread_csv関数でデータを読み込む。何故か文字化けする。

今回は都道府県別の消費者物価指数、その中の教養娯楽のデータを分析してみます。

政府統計の総合窓口(e-stat)のからデータをダウンロードしました。

www.e-stat.go.jp

f:id:cross_hyou:20210429084022p:plain

まず、都道府県を指定して、

f:id:cross_hyou:20210429084229p:plain

総人口、県内総生産額、消費者物価指数の総合と教養娯楽の4つのデータを選択しました。

f:id:cross_hyou:20210429084532p:plain

このようなCSVファイルをダウンロードしました。9行目に私が変数名を付け加えました。

このCSVファイルをR言語に読み込みます。

まず、何かと便利なtidyverseパッケージの読み込みをします。

f:id:cross_hyou:20210429084921p:plain

read_csv関数で読み込んでみます。

f:id:cross_hyou:20210429085404p:plain

skip = で8行を飛ばして、9行目から読み込むように指示しています。

na = でNAとして読み込む文字列を指定しています。

locale = でファイルのエンコーディングをUTF-8だと指示しています。

str関数でデータが読み込まれているのか確認します。

f:id:cross_hyou:20210429085702p:plain

あれれ。yearとprefこれは調査年と都道府県名なのですが文字化けしていますね。。

なんでかな?

CSVファイルをUTF-8で保存したんですけどね。。

f:id:cross_hyou:20210429090406p:plain

CSV(コンマ区切り)で保存してみます。

f:id:cross_hyou:20210429090528p:plain

再度read_csv関数で読み込んでみたのですがダメです。。

f:id:cross_hyou:20210429090716p:plain

UTF-8で保存しなおして、read.csv関数で読み込んでみます。

f:id:cross_hyou:20210429091001p:plain

f:id:cross_hyou:20210429091201p:plain

う~ん。だめです。。。

f:id:cross_hyou:20210429092848p:plain

しょうがないのでこのように、CSVファイルのほうを直しました。

これで読み込んでみます。

f:id:cross_hyou:20210429093004p:plain

無事に読み込むことができました。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。