crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

県内総生産額と交通事故件数のデータの分析2 - R言語で分析。県内総生産額当りの事故件数は東京都が一番少なく、佐賀県が一番多い。

 

www.crosshyou.info

 の続きです。

まず、データがどんなだったか、summary関数で確認します。

f:id:cross_hyou:20190601112623j:plain

47都道府県の10年間のデータです。

Prodが県内総生産額で、百万円単位です。

Acciが交通事故件数で、1件単位です。

Ratioが県内総生産額100万円当りの交通事故件数です。

まずは、年度ごとのRatioの平均値をtapply関数で算出しましょう。

f:id:cross_hyou:20190601113130j:plain

1975年度などNAがいっぱいですね。これは、Yearによけいなファクタ水準が残っていたからですね。余計なファクタ水準を削除しましょう。as.character関数でいったん文字列にしてから、as.factor関数で再度ファクタに戻します。

f:id:cross_hyou:20190601113453j:plain

これで、もういちどtapply関数をしてみます。

f:id:cross_hyou:20190601113640j:plain

2006年度は0.0018, 2007年度は0.0017...2014年度は0.0012, 2015年度は0.0011と年々減っていることがわかります。

同じように、tapply関数で都道府県ごとのRatioの平均値を算出してみます。

f:id:cross_hyou:20190601114028j:plain

都道府県の数が多くてどれが一番Ratioが高くて、どれが低いかわからないですね。

一旦結果をベクトルにしてsortで並び替えましょう。

f:id:cross_hyou:20190601114403j:plain

東京都が一番Ratioが低く、佐賀県がRatioが一番高いことがわかります。

今回は以上です。

ところで、今回から、結果の画像が少し変わったことにお気づきでしょうか?

今回から、RStudioで結果を表示しています。