Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

犯罪統計分析3 - 平成29年(1~6月) と平成30年(1~6月)で検挙率に違いはあるか?(tapply関数, prop.test関数)

今回は犯罪統計のデータから、平成29年(1~6月)の検挙率と平成30年(1~6月)の検挙率で違いはあるのかどうかを調べようと思います。

まずは、csvファイルに保存してあるデータをread.csv関数で読込み、head関数ではじめの6行を表示し、summary関数でデータのサマリーを表示します。

f:id:cross_hyou:20180721161457j:plain

tapply関数を使って、年ごとの認知件数の合計と検挙件数の合計を計算します。

f:id:cross_hyou:20180721161837j:plain

平成29年の認知件数は44万7820件、検挙件数は15万9628件です。

平成30年の認知件数は39万5826件、検挙件数は15万1109件です。

検挙率を計算してみましょう。

f:id:cross_hyou:20180721162246j:plain

平成29年の検挙率は35.6%です。

平成30年の検挙率は38.2%です。

平成30年の検挙率のほうが高いですが、統計的に有意な差でしょうか?

prop.test関数で検証します。

f:id:cross_hyou:20180721163021j:plain

p-value < 2.2e-16 < 0.05 ですから、35.6%と38.2%は統計的に有意に差があるといえます。

平成30年(1~6月)は前年と比べて犯罪件数が減り、検挙率が上昇したので、平成29年(1~6月)と比べて安全になったとようです。