www.crosshyou.infoの続きです。
前回作成した人口密度や1人当りの課税所得など、分析に必要なデータだけのデータフレームを作ります。
perIncやperS, perLの値の大きさがバラバラなので、データを標準化しようと思います。
min-max法という標準化方法ですね。(個々のデータ - データ全体の最小値) / (データ全体の最大値 - データ全体の最小値)という計算で標準化します。最小値が0, 最大値が0になります。
sapply関数とmin関数で各変数の最小値、sapply関数とmax関数で各変数の最大値を求め、scale関数で標準化します。
summary関数でみると、どの変数も最小値が0、最大値が1になっていることがわかります。
boxplot関数で箱ひげ図を作成します。
for関数とhist関数でMits, perInc, perS, perLのヒストグラムをいっぺんに描きます。
MitsuやperLは右の裾野が広い分布ですね。
pairs関数で散布図マトリックスを描きます。
YearはperSとだけ直線的な相関がありそうですね。
MitsuはperIncとPerLと相関がありそうです。
cor関数で相関係数マトリックスを見てみます。
一番相関が強いのは、MitsuとperLです。YearとMitsuは0.000と全くの無相関です。
今回は以上です。