の続きです。
2001年と2008年のgoraku: 消費者物価指数・教養娯楽の比較をしてみます。
どこの都道府県が大きく変化したのでしょうか?
2001年のデータフレームを作ります。
同様に2008年だけのデータフレームを作ります。
inner_join関数でdf2001とdf2008を結合します。
ew2008とbig32008は削除して、ew2001をewに、big32001をbig3に名前を変えます。
#
mutate関数でそれぞれの差分の変数を作ります。
select関数でpref, ew, big3とdiff_の差分のデータだけを残しました。
それぞれの変数のヒストグラムをhist関数で見てみます。
diff_goraku: gorakuの変化幅から見てみます。
全ての都道府県でマイナスですね、
次はdiff_cpi: cpiの変化幅です。
abline関数で平均値の位置に赤い垂直線を加えました。
cpiは上昇した都道府県もあれば下落した都道府県もありますね。
lwd = 2 というオプションを入れて、赤い垂直線の幅を太くしました。
1人当たり県内総生産額も増えた都道府県もあれば減少した都道府県もあります。
hist関数のヒストグラムをオブジェクトに保存すると、$breaksと$midsと$countsを使って度数分布表が作れます。人口は減少している都道府県が多いですね。
gdpの変化幅も減少しているところもあれば、増加しているところもあります。
今回は以上です。
次回は
です。
はじめから読むには、
です。