Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の企業の土地取得状況等に関する調査のデータ分析3 - Rで2006年と2008年の変化幅、変化率を調べる。

Generated by Bing Image Creator: Photo of morning sunshine grass field, butterflies, birds, white clouds in the blue sky

www.crosshyou.info

の続きです。今回は2008年と2006年の変化幅を調べてみます。

まず、pivot_wider()関数で2006年のデータと2008年のデータを別々の列に格納します。

pivot_wider()関数は、pivot_wider(names_from = 新しく作る列名が入っている既存の列,

 values_from = 新しい列に入れる値が入っている列) というように使います。

次にmutate()関数で変化幅を計算します。

mutate()関数で変化幅を計算して、select()関数で列を並び替えました、左から順番にpref, num_chg, area_chgを表示するようにして、残りはeverything()で順番をかえないようにしています。

変化幅の基本統計量をsummary()関数で確認します。

num_chg: 企業数【社】総数 総数の変化幅は最大値でもマイナス10ですので、すべての都道府県で企業数は減少しています。

area_chg: 面積【ha】総数 総数の変化幅は中央値は268、平均値は2786なので多くの都道府県で増加しています。

それぞれのヒストグラムみてみます。

左側に裾野が広がっている分布です。

area_num: 面積【ha】総数 総数のヒストグラムを描きます。

こんどは、右側に裾野が広がっている分布形状ですね。

変化幅ではなくて、変化率を計算してみましょう。

summary()関数で基本統計量をみてみます。

変化率でみると、企業数のほうは-19.2% から -2.959% で、面積のほうは-43.256%から 222.97%となっています。面積の変化率のほうがバラツキ度合いが大きいようですね。

こちらもヒストグラムを描いてみましょう。

変化率のヒストグラムのほうが左右対称に近いですね。

area_chg_pct: 面積【ha】総数 総数の変化率のヒストグラム描きます。

こちらは、右側の裾野が広がっている分布で、変わらないですね。

geom_col()関数を使って、各都道府県の値を棒グラフでみてみます。

長野県が一番企業数の変化率が大きいですね。面積の変化率で色をつけてみましたが、あんまり関連性は無い感じです。

おなじようにして、area_chg_pctもグラフにしてみます。

愛媛県が一番面積が増えた割合が大きいですね。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。