crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

経済センサスの事業所に関する集計データの分析6 - R言語で伸び率を計算する

 

www.crosshyou.info

 の続きです。

今回は2012年から2016年の各変数の伸び率を計算しようと思います。

まず、2016年の地域の並びと2012年の地域の並びが違っているので、これを揃えようと思います。

f:id:cross_hyou:20190218184349j:plain

f:id:cross_hyou:20190218184406j:plain

手順としては、2016年だけのデータフレーム、2012年だけのデータフレームを作成して、data2012[order(data2012$地域), ] のようにして地域の並び替えをしています。

これで、2016年のデータフレームも2012年のデータフレームも同じ並び順になりました。

伸び率を計算しましょう。3列目の事業所数から8列目の面積従業者数までの伸び率を計算します。

f:id:cross_hyou:20190218184837j:plain

100をかけてパーセント表示にしたほうがいいかな?round関数を使って、小数点3位までにしましょう。

f:id:cross_hyou:20190218185116j:plain

スッキリしましたね。あとは、地域を示す列を加えましょう。

f:id:cross_hyou:20190218185438j:plain

できました。summary関数で平均値などをみてみましょう。

f:id:cross_hyou:20190218185641j:plain

事業所数の平均は、マイナス0.5946ですが、総従業者数の平均はプラス2.3030となっています。男性従業者数の伸び率よりも女性従業者数の伸び率のほうが高いですね。

このデータフレームは14の地域があり、変数は6種類ありますから、データポイントは84データポイントあります。この84全部のデータポイントでヒストグラムを描いてみましょう。

f:id:cross_hyou:20190218190233j:plain

f:id:cross_hyou:20190218190246j:plain

0を中心に正規分布っぽい分布ですね。

それぞれの伸び率を高い順に表示しましょう。いちいちコマンドを入力するのは面倒なので、for関数を使って繰り返し処理をします。

f:id:cross_hyou:20190218191107j:plain

このような感じでコマンドを書きました。これを実行すると、以下のようになります。

f:id:cross_hyou:20190218191215j:plain

事業所数は仙台が一番伸びています。新潟が一番減少です。

f:id:cross_hyou:20190218191318j:plain

総事業者数も仙台が一番の伸びです。松山が一番の減少です。

f:id:cross_hyou:20190218191455j:plain

男性従業者数も仙台が一番の伸び、松山が一番の減少です。

f:id:cross_hyou:20190218191558j:plain

女性従業者数も仙台が一番の伸び、松山が一番の減少、というか松山だけが減少です。

f:id:cross_hyou:20190218191706j:plain

面積事業所数、これは1平方キロメートル当たりの事業所数です。関東が一番の伸びで、札幌が一番減少しています。

f:id:cross_hyou:20190218192002j:plain

面積従業者数、これは1平方キロメートル当たりの従業者数です。関東が一番の伸びで、札幌が一番の減少です。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。