Generated by Bing Image Creator: Photo of morning sunshine grass field, butterflies, birds, white clouds in the blue sky
の続きです。今回は2008年と2006年の変化幅を調べてみます。
まず、pivot_wider()関数で2006年のデータと2008年のデータを別々の列に格納します。
pivot_wider()関数は、pivot_wider(names_from = 新しく作る列名が入っている既存の列,
values_from = 新しい列に入れる値が入っている列) というように使います。
次にmutate()関数で変化幅を計算します。
mutate()関数で変化幅を計算して、select()関数で列を並び替えました、左から順番にpref, num_chg, area_chgを表示するようにして、残りはeverything()で順番をかえないようにしています。
変化幅の基本統計量をsummary()関数で確認します。
num_chg: 企業数【社】総数 総数の変化幅は最大値でもマイナス10ですので、すべての都道府県で企業数は減少しています。
area_chg: 面積【ha】総数 総数の変化幅は中央値は268、平均値は2786なので多くの都道府県で増加しています。
それぞれのヒストグラムみてみます。
左側に裾野が広がっている分布です。
area_num: 面積【ha】総数 総数のヒストグラムを描きます。
こんどは、右側に裾野が広がっている分布形状ですね。
変化幅ではなくて、変化率を計算してみましょう。
summary()関数で基本統計量をみてみます。
変化率でみると、企業数のほうは-19.2% から -2.959% で、面積のほうは-43.256%から 222.97%となっています。面積の変化率のほうがバラツキ度合いが大きいようですね。
こちらもヒストグラムを描いてみましょう。
変化率のヒストグラムのほうが左右対称に近いですね。
area_chg_pct: 面積【ha】総数 総数の変化率のヒストグラム描きます。
こちらは、右側の裾野が広がっている分布で、変わらないですね。
geom_col()関数を使って、各都道府県の値を棒グラフでみてみます。
長野県が一番企業数の変化率が大きいですね。面積の変化率で色をつけてみましたが、あんまり関連性は無い感じです。
おなじようにして、area_chg_pctもグラフにしてみます。
愛媛県が一番面積が増えた割合が大きいですね。
今回は以上です。
次回は、
です。
はじめから読むには、
です。