Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

犯罪統計分析2 - 検挙率の高い犯罪・検挙率の低い犯罪(order関数, tapply関数)

今回は、犯罪統計分析を使って、検挙率の高い犯罪・低い犯罪を調べてみようと思います。まずは、read.csv関数でデータを読込み、head関数で始めの6行を表示して、summary関数でデータの要約をしたいと思います。

f:id:cross_hyou:20180721152027j:plain

データは、認知件数、検挙件数、検挙人員とありますが、検挙率はありません。

hanzai$検挙率 <- hanzai$検挙件数 / hanzai$認知件数 * 100

とコマンド入力して、検挙率を計算しましょう。

f:id:cross_hyou:20180721152454j:plain

このようになります。平成30年の殺人は認知件数が464件で検挙件数が447件ですから検挙率が96.33621%です。

order関数で検挙率の高い順にならびかえてみましょう。

f:id:cross_hyou:20180721153331j:plain

あれれ!?検挙率が100%よりも高い犯罪が2つあります!背任は認知件数が25件で検挙件数が39件なので検挙率が156%です。賭博は84件の認知件数に対して検挙件数が120件で検挙率が142%です。これは前の年以前に認知されていた犯罪が今年になって検挙されたということなのでしょうか?

続いて、検挙率の低い順に並び替えてみましょう。

f:id:cross_hyou:20180721154021j:plain

平成30年の乗り物盗が、9.25%で平成29年の乗り物盗が9.36%で検挙率ワーストの1位と2位です。乗り物盗ってなんですかね?自転車泥棒かな?

犯罪の大分類ごとの検挙率を見てみましょう。

まずは、tapply関数をつかって、大分類ごとの認知件数の合計値を出します。

f:id:cross_hyou:20180721155728j:plain

続いて、大分類ごとの検挙件数の合計値を出します。

f:id:cross_hyou:20180721155945j:plain

kenkyo / ninchi * 100 で検挙率です。

f:id:cross_hyou:20180721160239j:plain

round関数で小数点以下2桁にまるめています。

凶悪犯の検挙率は、86.98%です。その他は、28.04%です。