の続きです。
前回は東京都のデータで、年によって、月によって発行数に違いがあるかどうかを調べました。
今回は47都道府県全部のデータをもう少し分析しやすく修正してみます。
まずは、もういちど、データがどのようなものか確認します。
都道府県、年、パスポート発行数、月のデータです。年と月を合わせた列を作りたいです。
strptime関数を使えばいいようです。
paste0関数でyearとmonthから20217/12/15のような文字列型データを作り、これをstrptime関数で日付型データに変更しました。
summary関数でみてみます。
dateは日付型なので、最小値や平均値など、数値型と同じ出力になっています。
yearとmonthをファクタ型に変換します。
monthのファクターの順番がm1, m10, m11と実際の月の順番と違うので、修正します。
これでうまくできました。
今回は以上です。
次回は
です。
第1回目は
です。