crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の災害被害額のデータ分析1 - 宮城県、岩手県、福島県はやっぱり多かった。

今回は都道府県別の自然災害額のデータを分析します。

政府統計の総合窓口、e-Statのウエブサイトからデータを取得します。

www.e-stat.go.jp

f:id:cross_hyou:20200415184232j:plain

地域は47都道府県です。

f:id:cross_hyou:20200415184259j:plain

総人口、県内総生産額、災害被害額のデータを選択しました。

f:id:cross_hyou:20200415184357j:plain

こういうCSVファイルです。

このファイルを、R言語のread.csv関数で読み込み、分析をしていきます。

f:id:cross_hyou:20200415184548j:plain

str関数でdfの構造を確認します。

f:id:cross_hyou:20200415184642j:plain

2068の行と5列のデータフレームです。NAがいっぱいあるので、na.omit関数でNAのある行を削除します。

f:id:cross_hyou:20200415184808j:plain

df1のサマリをsummary関数でみてみます。

f:id:cross_hyou:20200415184910j:plain

Prefの度数が各県とも10ですから、10年間のデータがありますね。

人口(Popu), 県内総生産額(GDP), 災害被害額(Saigai)の10年間のデータを各都道府県ごとの平均値にします。

tapply関数とmean関数を使います。

f:id:cross_hyou:20200415192057j:plain

 10年間の平均って何年から何年なのか確認しておきます。df1$Yearだけでsummary関数を使います。

f:id:cross_hyou:20200416084544j:plain

2006年度から2015年度が度数が47ですので、この期間の平均値ということですね。

それぞれの平均値を小さい順に表示してみます。sort関数を使います。

f:id:cross_hyou:20200416084927j:plain

鳥取県が約59万人で一番少ないです。

県内総生産額を表示します。

f:id:cross_hyou:20200416093035j:plain

鳥取県が一番少ないです。人口が少ないから当たり前ですね。人口で割って1人当りの県内総生産額も計算しましょう。

f:id:cross_hyou:20200416093525j:plain

奈良県が一番低いです。

災害被害額を小さい順に表示します。

f:id:cross_hyou:20200416093822j:plain

宮城県、岩手県、福島県は東日本大震災の影響だと思います。後で確認しようと思います。

今回は以上です。