の続きです。
前回の分析で、人口(a11Popu)と県内総生産額(a11GDP)は対数にしたほうが分布が正規分布に近づくことがわかりましたので、この二つは対数に変換します。
log関数を使いました。
こうして作成した、la11Popuとla11GDP、そしてa11Saigaiの3つの変数でデータフレームを作成します。
data.frame関数を使いました。
作成したデータフレームdf2をhead関数で始めの6行だけ表示しました。
この3つの変数の相関係数を調べましょう。
cor関数を使います。
la11Popuとla11GDPは相関係数を0.98と1に近いですね。
a11Saigaiはla11Popuとは-0.047, la11GDPとは-0.091とほとんどゼロですね。
plot関数で散布図マトリックスを作ります。
la11Popuとla11GDPの散布図は、ほぼ一直線になっていますが、a11Saigaiとの散布図はバラバラに点がプロットされています。
a11Saigaiがla11Popu, la11GDPと本当に相関がないのか、coplot関数でみてみます。
la11GDPの値で6つにわけてa11Saigaiとla11Popuの散布図を描きました。どの散布図もバラバラにプロットされていますね。
災害被害額は、人口、県内総生産額とは関連はなさそうですね。
cor.test関数で相関係数が0かどうか検定してみます。
a11Saigaiとla11Popuのp-valueは0.7524, a11Saigaiとla11GDPのp-valueは0.5404とどちらも0.05よりも大きいです。
災害被害額は、人口や県内総生産額とか関係ないということですね。
今回は以上です。