の続きです。
今回は、前回に引き続き、2015年調査のデータに注目して、各変数のヒストグラムを作成してみたいと思います。
まずは、各変数の2015年調査のデータを作成します。tapply関数を使って都道府県別のデータを作成します。
Non215は2015年調査の従業も通学もしていない人口の割合。
Sala215は2015年調査の1人当りの賃金・俸給。
Zai215は2015年調査の1人当りの財産所得。
Tou215は2015年調査の1人当りの一般事業投資額。
Sho15は2015年調査の1人当りの県民所得です。
こうして作成した各変数をhist関数でヒストグラムにします。
これだと、各変数のスケールがバラバラなので、ヒストグラムの形状は比較できますが、バラツキどあいは比較できないですね。データを正規化してみましょう。scale関数を使います。
Zai215(2015年調査の1人当り財産所得)が右側にひとつ離れ小島のようになっているデータがありますね。東京都です。
正規化したデータで箱ひげ図も描きましょう。boxplot関数を使います。
cex = 4 というオプションを入れて、外れ値のまるを大きくわかりやすくしました。
今回は以上です。