www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全国主要都市の第1次、第2次、第3次産業就業者数のデータ分析7 - R言語でヒストグラムや箱ひげ図を描く

 

www.crosshyou.info

 の続きです。

今回は前回作成した変化幅の変数をヒストグラムや箱ひげ図でグラフにします。

まず、作成した5つの変化幅の変数を一つのデータフレームにまとめます。R言語のdata.frame関数を使います。

f:id:cross_hyou:20200523124752j:plain

summary関数で各変数の平均値などを確認しましょう。

f:id:cross_hyou:20200523125024j:plain

ChgRatio1の平均値は、-2.5, chgRatio2の平均値は-8.6, chgRatio3の平均値は+11.1です。

それでは、boxplot関数で箱ひげ図を描きます。scale関数で平均値0, 標準偏差1に標準化してからboxplot関数を適用します。

f:id:cross_hyou:20200523125310j:plain

f:id:cross_hyou:20200523125323j:plain

chgMitsuとchgperIncには外れ値がありますが、chgRatio1, 2, 3には外れ値は無いです。

hist関数でヒストグラムを描きます。for関数をつかって一度に描きます。

f:id:cross_hyou:20200523125600j:plain

f:id:cross_hyou:20200523125618j:plain

sort関数とplot関数で小さい順グラフを描きます。

f:id:cross_hyou:20200523125818j:plain

f:id:cross_hyou:20200523125856j:plain

chgMitsuやchgperIncに外れ値があるのが実感できますね。

そうだ、この小さい順グラフに箱ひげ図の下ひげ、上ひげ、第1分位、中央値、第3分位の水平線を引くようなグラフを描く関数を作ってみましょう。

f:id:cross_hyou:20200523131647j:plain

箱ひげ図のboxplot関数は、plot = FALSEでグラフを書かないようにできます。

そして、$statsという名前で下ひげ、上ひげなどの数値を呼び出せます。

早速、うまくてきたかやってみます。

f:id:cross_hyou:20200523132032j:plain

f:id:cross_hyou:20200523132043j:plain

うまくいきました。

f:id:cross_hyou:20200523132338j:plain

f:id:cross_hyou:20200523132357j:plain

うまくいきましたね!

pairs関数で散布図マトリックスを描きます。

f:id:cross_hyou:20200523132533j:plain

f:id:cross_hyou:20200523132543j:plain

cor関数で相関係数マトリックスをだします。

f:id:cross_hyou:20200523132729j:plain

今回は以上です。