の続きです。
まず、データがどんなだったか、summary関数で確認します。
47都道府県の10年間のデータです。
Prodが県内総生産額で、百万円単位です。
Acciが交通事故件数で、1件単位です。
Ratioが県内総生産額100万円当りの交通事故件数です。
まずは、年度ごとのRatioの平均値をtapply関数で算出しましょう。
1975年度などNAがいっぱいですね。これは、Yearによけいなファクタ水準が残っていたからですね。余計なファクタ水準を削除しましょう。as.character関数でいったん文字列にしてから、as.factor関数で再度ファクタに戻します。
これで、もういちどtapply関数をしてみます。
2006年度は0.0018, 2007年度は0.0017...2014年度は0.0012, 2015年度は0.0011と年々減っていることがわかります。
同じように、tapply関数で都道府県ごとのRatioの平均値を算出してみます。
都道府県の数が多くてどれが一番Ratioが高くて、どれが低いかわからないですね。
一旦結果をベクトルにしてsortで並び替えましょう。
東京都が一番Ratioが低く、佐賀県がRatioが一番高いことがわかります。
今回は以上です。
ところで、今回から、結果の画像が少し変わったことにお気づきでしょうか?
今回から、RStudioで結果を表示しています。