Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の災害被害額のデータ分析3 - 人口と県内総生産額は対数正規分布に近く、災害被害額は正規分布に近い。

 

www.crosshyou.info

 の続きです。

今回は、R言語のplot関数なので、前回に作成したデータをグラフにしてみます。

はじめにplot関数で小さい順に並びかえてグラフにしてみます。

f:id:cross_hyou:20200418104141j:plain

f:id:cross_hyou:20200418104202j:plain

sort関数で並び変えてplot関数でグラフにしています。abline関数で縦線と横線を引きました。縦線が真ん中の線で、横線が平均値です。

左の赤いグラフが、a11Popu(2011年度を除いた、都道府県別の平均人口)、

真ん中の青いグラフが、a11GDP(2011年度を除いた、都道府県別の平均県内総生産額)、

右の緑のグラフが、a11Saigai(2011年度を除いた、都道府県別の平均災害被害額)です。

災害被害額は人口や県内総生産額と比べると直線に近いですね。

 

今度は、boxplot関数で箱ひげ図を描いてみます。

f:id:cross_hyou:20200418105438j:plain

f:id:cross_hyou:20200418105452j:plain

a11Popu, a11GDPは上のほうに外れ値が複数あります。a11Saigaiは上のほうに外れ値が1つありますが、それほど外れているという感じではないですね。

 

hist関数でヒストグラムを描きます。

f:id:cross_hyou:20200418110534j:plain

f:id:cross_hyou:20200418110546j:plain

abline関数で点線の縦線を中央値の位置にひきました。

 

qqnorm関数とqqline関数で、a11opu, a11GDP, a11Saigaiが正規分布になっているかを視覚化してみます。

f:id:cross_hyou:20200418111237j:plain

f:id:cross_hyou:20200418111248j:plain

a11Popuとa11GDPは明らかに正規分布ではないですね。

先日読んだ本、

 

 に都市の人口や国のGDPは前年の値をベースにして成長していくから正規分布ではなくて、対数正規分布になる、と書いてありました。災害被害額は前年の値がベースにはならず、毎年毎年ランダムに災害が発生しますから正規分布ですね。

対数値を取ってNomal Q-Q Plotを描いてみます。

f:id:cross_hyou:20200418112355j:plain

f:id:cross_hyou:20200418112458j:plain

対数値をとったNomal Q-Q Plotはa11Popu, a11GDPで正規分布に近い感じになりましたね。

今回は以上です。