の続きです。
今回は、R言語のplot関数なので、前回に作成したデータをグラフにしてみます。
はじめにplot関数で小さい順に並びかえてグラフにしてみます。
sort関数で並び変えてplot関数でグラフにしています。abline関数で縦線と横線を引きました。縦線が真ん中の線で、横線が平均値です。
左の赤いグラフが、a11Popu(2011年度を除いた、都道府県別の平均人口)、
真ん中の青いグラフが、a11GDP(2011年度を除いた、都道府県別の平均県内総生産額)、
右の緑のグラフが、a11Saigai(2011年度を除いた、都道府県別の平均災害被害額)です。
災害被害額は人口や県内総生産額と比べると直線に近いですね。
今度は、boxplot関数で箱ひげ図を描いてみます。
a11Popu, a11GDPは上のほうに外れ値が複数あります。a11Saigaiは上のほうに外れ値が1つありますが、それほど外れているという感じではないですね。
hist関数でヒストグラムを描きます。
abline関数で点線の縦線を中央値の位置にひきました。
qqnorm関数とqqline関数で、a11opu, a11GDP, a11Saigaiが正規分布になっているかを視覚化してみます。
a11Popuとa11GDPは明らかに正規分布ではないですね。
先日読んだ本、
に都市の人口や国のGDPは前年の値をベースにして成長していくから正規分布ではなくて、対数正規分布になる、と書いてありました。災害被害額は前年の値がベースにはならず、毎年毎年ランダムに災害が発生しますから正規分布ですね。
対数値を取ってNomal Q-Q Plotを描いてみます。
対数値をとったNomal Q-Q Plotはa11Popu, a11GDPで正規分布に近い感じになりましたね。
今回は以上です。