Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の一般事業投資額のデータ分析3 - R言語のscale関数で正規化してヒストグラムと箱ひげ図を描く。

 

www.crosshyou.info

 の続きです。

今回は、前回に引き続き、2015年調査のデータに注目して、各変数のヒストグラムを作成してみたいと思います。

まずは、各変数の2015年調査のデータを作成します。tapply関数を使って都道府県別のデータを作成します。

Non215は2015年調査の従業も通学もしていない人口の割合。

Sala215は2015年調査の1人当りの賃金・俸給。

Zai215は2015年調査の1人当りの財産所得。

Tou215は2015年調査の1人当りの一般事業投資額。

Sho15は2015年調査の1人当りの県民所得です。

f:id:cross_hyou:20200331183724j:plain

こうして作成した各変数をhist関数でヒストグラムにします。

f:id:cross_hyou:20200331183917j:plain

f:id:cross_hyou:20200331183837j:plain

これだと、各変数のスケールがバラバラなので、ヒストグラムの形状は比較できますが、バラツキどあいは比較できないですね。データを正規化してみましょう。scale関数を使います。

f:id:cross_hyou:20200331185126j:plain

 

f:id:cross_hyou:20200331185148j:plain


Zai215(2015年調査の1人当り財産所得)が右側にひとつ離れ小島のようになっているデータがありますね。東京都です。

正規化したデータで箱ひげ図も描きましょう。boxplot関数を使います。

f:id:cross_hyou:20200331192109j:plain

f:id:cross_hyou:20200331192120j:plain

cex = 4 というオプションを入れて、外れ値のまるを大きくわかりやすくしました。

今回は以上です。