今回は犯罪統計のデータから、平成29年(1~6月)の検挙率と平成30年(1~6月)の検挙率で違いはあるのかどうかを調べようと思います。
まずは、csvファイルに保存してあるデータをread.csv関数で読込み、head関数ではじめの6行を表示し、summary関数でデータのサマリーを表示します。
tapply関数を使って、年ごとの認知件数の合計と検挙件数の合計を計算します。
平成29年の認知件数は44万7820件、検挙件数は15万9628件です。
平成30年の認知件数は39万5826件、検挙件数は15万1109件です。
検挙率を計算してみましょう。
平成29年の検挙率は35.6%です。
平成30年の検挙率は38.2%です。
平成30年の検挙率のほうが高いですが、統計的に有意な差でしょうか?
prop.test関数で検証します。
p-value < 2.2e-16 < 0.05 ですから、35.6%と38.2%は統計的に有意に差があるといえます。
平成30年(1~6月)は前年と比べて犯罪件数が減り、検挙率が上昇したので、平成29年(1~6月)と比べて安全になったとようです。