の続きです。
boxplot関数で各データの箱ひげ図を描いてみます。scale関数で標準化して、データのバラツキ度合いを比較できるようにしました。
Houseには外れ値は無いです。FoodとWearには下の外れ値もあります。
pairs関数で散布図マトリックスを描きます。
cor関数で相関係数マトリックスを出します。round関数で小数点以下2桁の表示にしました。
perIncome(1人当りの課税所得)に注目すると、Popu(総人口), Income(課税所得), Food(食料費), Wear(被服・及び履物費), Mitsudo(人口密度)とはある程度の相関がありますが、House(住居費)とは相関は無さそうです。
Food, House, Wear, Mitsudo, perIncomeだけで散布図マトリックスを描いてみます。
これらのヒストグラムをhist関数で描きます。for関数でいちどに描いてしまいます。
Mitsudoが山のてっぺんが一番左にあって偏りのある分布ですね。Mistudoをlog関数で対数の値にしてみましょう。
すこし山のてっぺんが右に移動しましたね。
logMitsudoをMitsudoの代わりにして散布図マトリックスを描いてみます。
cor関数で相関マトリックスを描きます。
perIncomeと相関係数の高い順に並べると、Food, logMitsudo, Wear, Houseとなります。
今回は以上です。