crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

水害統計調査の分析1 - 全国の水害の死者、行方不明者、負傷者、被害額

昨年は水害が多かったですね。

そこで今回は、国土交通省の「水害統計調査」のデータを使って全国の水害の死者、行方不明者、負傷者、被害額を見てみようと思います。

f:id:cross_hyou:20190110141012j:plain

水害統計調査は、1年間に発生した洪水、内水、高潮、津波、土石流等の水害被害を対象に、個人・法人が所有する各種資産、河川・道路等の公共土木施設及び運輸・通信等の公益事業施設等について、規模の大小を問わず1件1件その実態を調査している我が国唯一の統計調査であり、昭和36年より毎年継続して実施されております。

とのことです。

https://www.e-stat.go.jp/stat-search/database?page=1&toukei=00600590&tstat=000001088135&result_page=1

ここからデータを取得して、R言語に読込ませる為に事前処理をして下図のようなCSVファイルを作成しました。

f:id:cross_hyou:20190110141501j:plain

このC列からF列は人数で、G列の被害額は百万円単位です。なので、2014年の被害額は、2938億0800万円という大きな金額です。

早速、read.csv関数でR言語に読込みます。

f:id:cross_hyou:20190110142054j:plain

このデータフレームは各都道府県、関東地方などの地方、全国と3つのレベルの地域区分が一つになってしまっているので、まずは、全国レベルだけで見てみましょう。全国だけのデータフレームをsubset関数で作成します。

f:id:cross_hyou:20190110142854j:plain

2006年から2014年までのデータですね。死者は2011年が109人で一番多いですね。被害額も2011年が一番多く7286億7200万円もありました。

summary関数で基本統計量を算出します。

f:id:cross_hyou:20190110143214j:plain

標準偏差をapply関数とsd関数で算出します。

f:id:cross_hyou:20190110143417j:plain

変動係数(標準偏差 / 平均値)も算出しておきましょう。

f:id:cross_hyou:20190110143809j:plain


負傷者の数が一番年ごとのバラツキがあることがわかります。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。