crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

犯罪統計分析1 - 基本統計量(summary関数、 apply関数とlength関数、apply関数とsum関数、apply関数とsd関数)

e-Stat(政府統計の総合窓口)のサイトを見たら、平成30年1月~6月の犯罪統計というデータが新着でありました。

f:id:cross_hyou:20180719124421j:plain

早速、ファイルを開いてみました。

f:id:cross_hyou:20180719124608j:plain

平成30年1月~6月と平成29年1月~6月の犯罪の件数や検挙件数が犯罪の種類ごとにありました。

このデータを分析することにしましょう。

R言語で処理しやすいようにデータを下のように加工しました。

f:id:cross_hyou:20180719125439j:plain

このcsvファイルに保存したデータをread.csv関数でR言語に読込み、summary関数で基本の統計値を表示してみます。

f:id:cross_hyou:20180719125613j:plain

summary関数ではデータの個数、データの合計値、標準偏差が表示されませんので、apply関数とlength関数、apply関数とsum関数、apply関数とsd関数を組み合わせてそれぞれ計算しましょう。

f:id:cross_hyou:20180719130336j:plain

2年分のデータですから、犯罪の種類は26種類です。(52 / 2 = 26).
認知件数は2年で84万3646件、検挙件数は31万0737件、検挙人員は20万3301人です。

犯罪の認知は84万件なのに、検挙は31万件ですから半数以上の犯罪が検挙されていないのですね。。。