の続きです。
今回は2012年から2016年の各変数の伸び率を計算しようと思います。
まず、2016年の地域の並びと2012年の地域の並びが違っているので、これを揃えようと思います。
手順としては、2016年だけのデータフレーム、2012年だけのデータフレームを作成して、data2012[order(data2012$地域), ] のようにして地域の並び替えをしています。
これで、2016年のデータフレームも2012年のデータフレームも同じ並び順になりました。
伸び率を計算しましょう。3列目の事業所数から8列目の面積従業者数までの伸び率を計算します。
100をかけてパーセント表示にしたほうがいいかな?round関数を使って、小数点3位までにしましょう。
スッキリしましたね。あとは、地域を示す列を加えましょう。
できました。summary関数で平均値などをみてみましょう。
事業所数の平均は、マイナス0.5946ですが、総従業者数の平均はプラス2.3030となっています。男性従業者数の伸び率よりも女性従業者数の伸び率のほうが高いですね。
このデータフレームは14の地域があり、変数は6種類ありますから、データポイントは84データポイントあります。この84全部のデータポイントでヒストグラムを描いてみましょう。
0を中心に正規分布っぽい分布ですね。
それぞれの伸び率を高い順に表示しましょう。いちいちコマンドを入力するのは面倒なので、for関数を使って繰り返し処理をします。
このような感じでコマンドを書きました。これを実行すると、以下のようになります。
事業所数は仙台が一番伸びています。新潟が一番減少です。
総事業者数も仙台が一番の伸びです。松山が一番の減少です。
男性従業者数も仙台が一番の伸び、松山が一番の減少です。
女性従業者数も仙台が一番の伸び、松山が一番の減少、というか松山だけが減少です。
面積事業所数、これは1平方キロメートル当たりの事業所数です。関東が一番の伸びで、札幌が一番減少しています。
面積従業者数、これは1平方キロメートル当たりの従業者数です。関東が一番の伸びで、札幌が一番の減少です。
今回は以上です。
次回は
です。