今回は、犯罪統計分析を使って、検挙率の高い犯罪・低い犯罪を調べてみようと思います。まずは、read.csv関数でデータを読込み、head関数で始めの6行を表示して、summary関数でデータの要約をしたいと思います。
データは、認知件数、検挙件数、検挙人員とありますが、検挙率はありません。
hanzai$検挙率 <- hanzai$検挙件数 / hanzai$認知件数 * 100
とコマンド入力して、検挙率を計算しましょう。
このようになります。平成30年の殺人は認知件数が464件で検挙件数が447件ですから検挙率が96.33621%です。
order関数で検挙率の高い順にならびかえてみましょう。
あれれ!?検挙率が100%よりも高い犯罪が2つあります!背任は認知件数が25件で検挙件数が39件なので検挙率が156%です。賭博は84件の認知件数に対して検挙件数が120件で検挙率が142%です。これは前の年以前に認知されていた犯罪が今年になって検挙されたということなのでしょうか?
続いて、検挙率の低い順に並び替えてみましょう。
平成30年の乗り物盗が、9.25%で平成29年の乗り物盗が9.36%で検挙率ワーストの1位と2位です。乗り物盗ってなんですかね?自転車泥棒かな?
犯罪の大分類ごとの検挙率を見てみましょう。
まずは、tapply関数をつかって、大分類ごとの認知件数の合計値を出します。
続いて、大分類ごとの検挙件数の合計値を出します。
kenkyo / ninchi * 100 で検挙率です。
round関数で小数点以下2桁にまるめています。
凶悪犯の検挙率は、86.98%です。その他は、28.04%です。