今回は都道府県別の自然災害額のデータを分析します。
政府統計の総合窓口、e-Statのウエブサイトからデータを取得します。
地域は47都道府県です。
総人口、県内総生産額、災害被害額のデータを選択しました。
こういうCSVファイルです。
このファイルを、R言語のread.csv関数で読み込み、分析をしていきます。
str関数でdfの構造を確認します。
2068の行と5列のデータフレームです。NAがいっぱいあるので、na.omit関数でNAのある行を削除します。
df1のサマリをsummary関数でみてみます。
Prefの度数が各県とも10ですから、10年間のデータがありますね。
人口(Popu), 県内総生産額(GDP), 災害被害額(Saigai)の10年間のデータを各都道府県ごとの平均値にします。
tapply関数とmean関数を使います。
10年間の平均って何年から何年なのか確認しておきます。df1$Yearだけでsummary関数を使います。
2006年度から2015年度が度数が47ですので、この期間の平均値ということですね。
それぞれの平均値を小さい順に表示してみます。sort関数を使います。
鳥取県が約59万人で一番少ないです。
県内総生産額を表示します。
鳥取県が一番少ないです。人口が少ないから当たり前ですね。人口で割って1人当りの県内総生産額も計算しましょう。
奈良県が一番低いです。
災害被害額を小さい順に表示します。
宮城県、岩手県、福島県は東日本大震災の影響だと思います。後で確認しようと思います。
今回は以上です。