今回は、都道府県別の1人当り最終消費エネルギーのデータを分析してみたいと思います。データはs-Stat(政府統計の総合窓口)から取得しました。
1人当り最終エネルギー消費量の他に、15-64歳人口割合(%)と1人当り県民所得(平成23年基準)(千円)も一緒にデータを取り込みました。
CSVファイルはこんな感じです。
R言語のread.csv関数でファイルを読込みます。
read.csv関数でCSVファイルを読み込むときに、skip = 8と指定しているので、9行目からデータを読込みます。また、na.strings = で***, X, - はNAとするように指定しています。
na.omit関数でNAを含む行をすべて削除しています。
str関数でdf1のデータ構造を確認しています。432の観測と5つの変数があります。
summary関数でそれぞれの変数を見てみます。
Year変数は2005年度や2018年度など0(データが無い)のファクターレベルがあります。これを無くしてしまいましょう。
as.character関数でファクタ型のデータだったのを文字列型のデータにしました。それをas.factor関数で再度ファクタ型に戻すとデータの無いファクターレベルが削除されます。2007年度から2015年度まで9年間のデータがあるとわかります。すべて47とありますから、どの年度も47都道府県のデータが揃っていることがわかります。
次は、Pref変数を見てみます。
愛知県から和歌山県まですべて9とあります。9年間のデータですね。
Pratio, Shotoku, Energyはいっぺんにやってしまいましょう。
Pratioは15-64歳人口割合です。最低は55%, 最大は68.6%, 中央値は61.2%, 平均値は61.42%です。
Shotokuは1人当り県民所得(平成23年基準、千円です。最低は195万円、最大は590万9千円、中央値は268万円、平均値は272万3千円です。
Energyは1人当りの最終消費エネルギー量(GJ)です。最低は68.35GJ, 最大は367.29GJ, 中央値は119.24GJ, 平均値は138.73GJです。
ところで、このエネルギー量のGJってどのような単位なんでしょうか?1GJ(ギガジュール)で2憶3900万カロリーぐらいだそうです。よくわからないですが凄いエネルギー量ですね。
Pratio, Shotoku, Energyの標準偏差と変動係数も計算してみましょう。
標準偏差はsd関数で計算できます。変動係数は標準偏差を平均値で割った値ですが、平均値はmean関数で計算できます。
Pratioの標準偏差は2.6%で変動係数は0.04です。Shotokuの標準偏差は51万1千円で変動係数は0.19です。Energyの標準偏差は61.6GJで変動係数は0.44です。
Energy(1人当りの最終エネルギー消費量)のデータが一番変動の度合いが大きいことがわかります。
今回は以上です。