Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の食料費・住居費・被服及び履物費のデータ分析4 - R言語のboxplot関数、pairs関数、hist関数でデータを視覚化。

 

www.crosshyou.info

 の続きです。

boxplot関数で各データの箱ひげ図を描いてみます。scale関数で標準化して、データのバラツキ度合いを比較できるようにしました。

f:id:cross_hyou:20200506084611j:plain

f:id:cross_hyou:20200506084907j:plain

Houseには外れ値は無いです。FoodとWearには下の外れ値もあります。

 

pairs関数で散布図マトリックスを描きます。

f:id:cross_hyou:20200506085140j:plain

f:id:cross_hyou:20200506085152j:plain

 

cor関数で相関係数マトリックスを出します。round関数で小数点以下2桁の表示にしました。

f:id:cross_hyou:20200506085332j:plain

perIncome(1人当りの課税所得)に注目すると、Popu(総人口), Income(課税所得), Food(食料費), Wear(被服・及び履物費), Mitsudo(人口密度)とはある程度の相関がありますが、House(住居費)とは相関は無さそうです。

 

Food, House, Wear, Mitsudo, perIncomeだけで散布図マトリックスを描いてみます。

f:id:cross_hyou:20200506085911j:plain

f:id:cross_hyou:20200506085922j:plain

これらのヒストグラムをhist関数で描きます。for関数でいちどに描いてしまいます。

f:id:cross_hyou:20200506090228j:plain

 

f:id:cross_hyou:20200506090123j:plain

Mitsudoが山のてっぺんが一番左にあって偏りのある分布ですね。Mistudoをlog関数で対数の値にしてみましょう。

f:id:cross_hyou:20200506091113j:plain

f:id:cross_hyou:20200506091123j:plain


すこし山のてっぺんが右に移動しましたね。

logMitsudoをMitsudoの代わりにして散布図マトリックスを描いてみます。

f:id:cross_hyou:20200506091244j:plain

f:id:cross_hyou:20200506091257j:plain

cor関数で相関マトリックスを描きます。

f:id:cross_hyou:20200506091622j:plain

perIncomeと相関係数の高い順に並べると、Food, logMitsudo, Wear, Houseとなります。

今回は以上です。