e-Stat(政府統計の総合窓口)のサイトを見たら、平成30年1月~6月の犯罪統計というデータが新着でありました。
早速、ファイルを開いてみました。
平成30年1月~6月と平成29年1月~6月の犯罪の件数や検挙件数が犯罪の種類ごとにありました。
このデータを分析することにしましょう。
R言語で処理しやすいようにデータを下のように加工しました。
このcsvファイルに保存したデータをread.csv関数でR言語に読込み、summary関数で基本の統計値を表示してみます。
summary関数ではデータの個数、データの合計値、標準偏差が表示されませんので、apply関数とlength関数、apply関数とsum関数、apply関数とsd関数を組み合わせてそれぞれ計算しましょう。
2年分のデータですから、犯罪の種類は26種類です。(52 / 2 = 26).
認知件数は2年で84万3646件、検挙件数は31万0737件、検挙人員は20万3301人です。
犯罪の認知は84万件なのに、検挙は31万件ですから半数以上の犯罪が検挙されていないのですね。。。