Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

犯罪統計分析5 - 大分類で区分した検挙率(subset関数, tapply関数)

今回は、犯罪の種類を大分類で区分して、検挙率が高くなった犯罪、低くなった犯罪を調べようと思います。

まずは、csvファイルに保存してあるデータをread.csv関数で読込み、head関数で始めの6行を表示して、summary関数でデータのサマリーを見ましょう。

f:id:cross_hyou:20180724121032j:plain

subset関数を使って平成29年のデータセット、平成30年のデータセットを作ります。

f:id:cross_hyou:20180724121909j:plain

tapply関数を使って、平成29年の大分類別の認知件数、検挙件数、平成30年の大分類別の認知件数、検挙件数の4つのデータを作ります。

f:id:cross_hyou:20180724123113j:plain

よく見ると、認知件数は凶悪犯だけ増加しています。平成29年は2306件でしたが、平成30年は2486件です。犯罪全体は減っていましたが、凶悪犯が増えているのは問題ですね。

それでは、それぞれの年の検挙率を計算しましょう。

f:id:cross_hyou:20180724123823j:plain

凶悪犯の検挙率は上昇していますが、そのほかの犯罪の検挙率は下がっていますね。

変化幅を計算しましょう。

f:id:cross_hyou:20180724124251j:plain

このようになりました。