の続きです。
今回は各地方だけのデータフレームを作成して、基本統計量を作成したいと思います。
subset関数で作成します。
summary関数で基本統計量を表示しました。最大で81名の死者が出た地方があります。合計の最小値が0ですから、水害で被害にあった人がいなかった地方があることがわかります。
時間軸でグルーピングしてsummary関数を適用しましょう。by関数を利用します。
とりあえずby関数とsummary関数を実行してみましたが、データが多すぎてよくわからないですね。。
こんどはby関数とsummary関数を地方でグルーピングしてみましょう。
あら。。。愛知県や愛媛県などデータが無いけど残っていいるファクターもグルーピングされてしまうのですね。削除しましょう。
as.character関数でファクタ形式のデータを文字列形式のデータに変換し、factor関数で再度ファクタに変換しました。これでもう一回、by関数でやってみます。
うまくできましたね。
前回の全国だけのデータフレーム、allの都道府県 もいらないファクタレベルが残っていますから同じように削除しておきましょう。
はい、Levels:のところが「全国」だけになりましたね。
今回は以上です。
次回は
です。