の続きです。
今回は各都道府県だけのR言語データフレームを作成して基本統計量や最も被害があったのは何年のどこの県かなどを調べてみたいと思います。
subset関数で作成するのは同じです。
まずは上のようにkakuという名前のデータフレームを用意して、「全国」を削除しました。削除のときは、都道府県 != "全国" のようにします。
続いて、〇〇地方を削除しましょう。
前回の地方だけのデータフレーム作成に使用したコードを少し手直しして作成します。
kaku$都道府県には、全国や関東地方などいらないファクタのLevelsが残っていますから削除しましょう。
str関数を実行すると、Factor w/47 levels と表示されています。Levelsが47都道府県だけになったことがわかります。
order関数を使って並び替え表示をしましょう。まずは一番被害者の合計人数が多かったのは何年のどこの県でしょうか?
2006年の宮崎県は158名の被害者で一番多いです。
死者はどうでしょうか?
2014年の広島県が77名で一番でした。
行方不明者はどうでしょうか?
2011年の奈良県が10名で一番でした。
負傷者はどうでしょうか?
2006年の宮崎県が155名で一番でした。
被害額はどうでしょうか?
2011年の和歌山県が1556億8200万円で一番でした。
この水害統計調査のデータは2006年から2014年までの9年間です。この9年間合計の値を都道府県ごとにまとめてみましょう。tapply関数とsum関数でいけると思います。
まずは被害者の合計人数です。
sort関数で大きい順に並べています。宮崎県が9年間合計で186人で一番です。
死者はどうでしょうか?
広島県が86人で一番です。群馬、山梨、青森、大阪、長崎は9年間で死者が一人もいません。
行方不明者をみてみましょう。
奈良県が10人で一番です。行方不明者は少ないですね。
負傷者はどうでしょうか?
宮崎県が182人で一番です。
被害額をみます。
兵庫県が2058億3100万円で一番です。
こうして作成した合計合計値、死者合計値、行方不明者合計値、負傷者合計値、被害額合計値をまとめたデータフレームを作成します。data.frame関数で作成できます。
このように作成できました。
今回は以上です。
次回は
です。