www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

水害統計調査の分析2 - 各地方の水害の死者、行方不明者、負傷者、被害額

 

www.crosshyou.info

 の続きです。

今回は各地方だけのデータフレームを作成して、基本統計量を作成したいと思います。

subset関数で作成します。

f:id:cross_hyou:20190111122446j:plain

summary関数で基本統計量を表示しました。最大で81名の死者が出た地方があります。合計の最小値が0ですから、水害で被害にあった人がいなかった地方があることがわかります。

時間軸でグルーピングしてsummary関数を適用しましょう。by関数を利用します。

f:id:cross_hyou:20190111123136j:plain

f:id:cross_hyou:20190111123239j:plain

f:id:cross_hyou:20190111123328j:plain

f:id:cross_hyou:20190111123405j:plain

とりあえずby関数とsummary関数を実行してみましたが、データが多すぎてよくわからないですね。。

こんどはby関数とsummary関数を地方でグルーピングしてみましょう。

f:id:cross_hyou:20190111123814j:plain

あら。。。愛知県や愛媛県などデータが無いけど残っていいるファクターもグルーピングされてしまうのですね。削除しましょう。

f:id:cross_hyou:20190111125220j:plain



as.character関数でファクタ形式のデータを文字列形式のデータに変換し、factor関数で再度ファクタに変換しました。これでもう一回、by関数でやってみます。

f:id:cross_hyou:20190111125413j:plain

f:id:cross_hyou:20190111125425j:plain

f:id:cross_hyou:20190111125439j:plain

f:id:cross_hyou:20190111125450j:plain

うまくできましたね。

前回の全国だけのデータフレーム、allの都道府県 もいらないファクタレベルが残っていますから同じように削除しておきましょう。

f:id:cross_hyou:20190111125752j:plain

はい、Levels:のところが「全国」だけになりましたね。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。