Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の1人当り最終エネルギー消費量のデータ分析1 - R言語で基本統計量を計算する。

www.e-stat.go.jp

今回は、都道府県別の1人当り最終消費エネルギーのデータを分析してみたいと思います。データはs-Stat(政府統計の総合窓口)から取得しました。

f:id:cross_hyou:20200321112834p:plain

1人当り最終エネルギー消費量の他に、15-64歳人口割合(%)と1人当り県民所得(平成23年基準)(千円)も一緒にデータを取り込みました。

f:id:cross_hyou:20200321113111p:plain

CSVファイルはこんな感じです。

R言語のread.csv関数でファイルを読込みます。

f:id:cross_hyou:20200321113524p:plain

read.csv関数でCSVファイルを読み込むときに、skip = 8と指定しているので、9行目からデータを読込みます。また、na.strings = で***, X, - はNAとするように指定しています。

na.omit関数でNAを含む行をすべて削除しています。

str関数でdf1のデータ構造を確認しています。432の観測と5つの変数があります。

summary関数でそれぞれの変数を見てみます。

f:id:cross_hyou:20200321114128p:plain

Year変数は2005年度や2018年度など0(データが無い)のファクターレベルがあります。これを無くしてしまいましょう。

f:id:cross_hyou:20200321114258p:plain

as.character関数でファクタ型のデータだったのを文字列型のデータにしました。それをas.factor関数で再度ファクタ型に戻すとデータの無いファクターレベルが削除されます。2007年度から2015年度まで9年間のデータがあるとわかります。すべて47とありますから、どの年度も47都道府県のデータが揃っていることがわかります。

次は、Pref変数を見てみます。

f:id:cross_hyou:20200321114709p:plain

愛知県から和歌山県まですべて9とあります。9年間のデータですね。

Pratio, Shotoku, Energyはいっぺんにやってしまいましょう。

f:id:cross_hyou:20200321115031p:plain

Pratioは15-64歳人口割合です。最低は55%, 最大は68.6%, 中央値は61.2%, 平均値は61.42%です。

Shotokuは1人当り県民所得(平成23年基準、千円です。最低は195万円、最大は590万9千円、中央値は268万円、平均値は272万3千円です。

Energyは1人当りの最終消費エネルギー量(GJ)です。最低は68.35GJ, 最大は367.29GJ, 中央値は119.24GJ, 平均値は138.73GJです。

ところで、このエネルギー量のGJってどのような単位なんでしょうか?1GJ(ギガジュール)で2憶3900万カロリーぐらいだそうです。よくわからないですが凄いエネルギー量ですね。

Pratio, Shotoku, Energyの標準偏差と変動係数も計算してみましょう。

f:id:cross_hyou:20200321120654p:plain

標準偏差はsd関数で計算できます。変動係数は標準偏差を平均値で割った値ですが、平均値はmean関数で計算できます。

Pratioの標準偏差は2.6%で変動係数は0.04です。Shotokuの標準偏差は51万1千円で変動係数は0.19です。Energyの標準偏差は61.6GJで変動係数は0.44です。

Energy(1人当りの最終エネルギー消費量)のデータが一番変動の度合いが大きいことがわかります。

今回は以上です。