crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の消費者物価指数・教養娯楽のデータの分析4 - R言語のhist関数でヒストグラムと度数分布表を作る。

 

www.crosshyou.info

 の続きです。

2001年と2008年のgoraku: 消費者物価指数・教養娯楽の比較をしてみます。

どこの都道府県が大きく変化したのでしょうか?

2001年のデータフレームを作ります。

f:id:cross_hyou:20210502074833p:plain

同様に2008年だけのデータフレームを作ります。

f:id:cross_hyou:20210502075202p:plain

inner_join関数でdf2001とdf2008を結合します。

f:id:cross_hyou:20210502075450p:plain

ew2008とbig32008は削除して、ew2001をewに、big32001をbig3に名前を変えます。

f:id:cross_hyou:20210502075950p:plain

#

mutate関数でそれぞれの差分の変数を作ります。

f:id:cross_hyou:20210502080628p:plain

select関数でpref, ew, big3とdiff_の差分のデータだけを残しました。

それぞれの変数のヒストグラムをhist関数で見てみます。

diff_goraku: gorakuの変化幅から見てみます。

f:id:cross_hyou:20210502081016p:plain

f:id:cross_hyou:20210502081031p:plain

全ての都道府県でマイナスですね、

次はdiff_cpi: cpiの変化幅です。

f:id:cross_hyou:20210502081322p:plain

f:id:cross_hyou:20210502081335p:plain

abline関数で平均値の位置に赤い垂直線を加えました。

cpiは上昇した都道府県もあれば下落した都道府県もありますね。

f:id:cross_hyou:20210502081807p:plain

f:id:cross_hyou:20210502081822p:plain

lwd = 2 というオプションを入れて、赤い垂直線の幅を太くしました。

1人当たり県内総生産額も増えた都道府県もあれば減少した都道府県もあります。

f:id:cross_hyou:20210502083741p:plain

f:id:cross_hyou:20210502082702p:plain

hist関数のヒストグラムをオブジェクトに保存すると、$breaksと$midsと$countsを使って度数分布表が作れます。人口は減少している都道府県が多いですね。

f:id:cross_hyou:20210502084159p:plain

f:id:cross_hyou:20210502084214p:plain

gdpの変化幅も減少しているところもあれば、増加しているところもあります。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。