www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の災害被害額のデータ分析4 - 災害被害額は人口や県内総生産額とは関係ない。

 

www.crosshyou.info

 の続きです。

前回の分析で、人口(a11Popu)と県内総生産額(a11GDP)は対数にしたほうが分布が正規分布に近づくことがわかりましたので、この二つは対数に変換します。

log関数を使いました。

f:id:cross_hyou:20200419091516j:plain

こうして作成した、la11Popuとla11GDP、そしてa11Saigaiの3つの変数でデータフレームを作成します。

data.frame関数を使いました。

f:id:cross_hyou:20200419092122j:plain

作成したデータフレームdf2をhead関数で始めの6行だけ表示しました。

この3つの変数の相関係数を調べましょう。

cor関数を使います。

f:id:cross_hyou:20200419092406j:plain

la11Popuとla11GDPは相関係数を0.98と1に近いですね。

a11Saigaiはla11Popuとは-0.047, la11GDPとは-0.091とほとんどゼロですね。

plot関数で散布図マトリックスを作ります。

f:id:cross_hyou:20200419092739j:plain

f:id:cross_hyou:20200419092749j:plain

la11Popuとla11GDPの散布図は、ほぼ一直線になっていますが、a11Saigaiとの散布図はバラバラに点がプロットされています。

a11Saigaiがla11Popu, la11GDPと本当に相関がないのか、coplot関数でみてみます。

f:id:cross_hyou:20200419093802j:plain

f:id:cross_hyou:20200419093812j:plain

la11GDPの値で6つにわけてa11Saigaiとla11Popuの散布図を描きました。どの散布図もバラバラにプロットされていますね。

災害被害額は、人口、県内総生産額とは関連はなさそうですね。

cor.test関数で相関係数が0かどうか検定してみます。

f:id:cross_hyou:20200419094220j:plain

a11Saigaiとla11Popuのp-valueは0.7524, a11Saigaiとla11GDPのp-valueは0.5404とどちらも0.05よりも大きいです。

災害被害額は、人口や県内総生産額とか関係ないということですね。

今回は以上です。