Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の凶悪犯認知件数の分析1 - R言語で基本統計値を調べる。大阪府では1年で1000件以上も発生している。

今回は都道府県別の凶悪犯認知件数を分析します。

e-stat, 政府統計の総合窓口からデータを取得しました。

f:id:cross_hyou:20191024204103j:plain

説明変数として、総人口、可住地面積、県内総生産額も一緒に取得しました。

f:id:cross_hyou:20191024204202j:plain

このようなExcelファイルを作成しました。これをread.csv関数でR言語に読込ませ分析します。

f:id:cross_hyou:20191025063450j:plain

Badが凶悪犯認知件数です。一番少なくて12件、多くて1255件、平均値は163件、中央値は66件です。平均値と中央値に大きな差がありますね。偏りのあるデータ分布なのでしょう。グラフにしてみてみます。

f:id:cross_hyou:20191025063522j:plain

まず、gpという名前の3つのグラフを描く自作関数を作成しました。

f:id:cross_hyou:20191025063714j:plain

f:id:cross_hyou:20191025063728j:plain

ヒストグラムの分布の形状を見ると、右側に裾野が広がっている形状です。

年度を見てみましょう。

f:id:cross_hyou:20191025064044j:plain

2006年度から2015年度までの10年間のデータがあることがわかります。

1975年度などの不要なファクタ水準を削除します。

f:id:cross_hyou:20191025064313j:plain

全ての年度でデータが47個あるので、47都道府県すべてのデータが揃っている。ということですね。

都道府県ごとの過去10年間の平均の人口、可住地面積、県内総生産、凶悪犯認知件数を作成します。

f:id:cross_hyou:20191025064855j:plain

人口は鳥取県が一番少ないです。多いのは東京です。

f:id:cross_hyou:20191025065140j:plain

可住地面積の一番狭いのは奈良県なんですね。一番広いのは北海道です。

f:id:cross_hyou:20191025070146j:plain

県内総生産が一番少ないのは、鳥取県です。一番多いのは東京都です。

f:id:cross_hyou:20191025070431j:plain

凶悪犯認知件数が一番少ないのは島根県です。一番多いのは大阪府です。

このavgBadのグラフを見てみましょう。

f:id:cross_hyou:20191025070935j:plain

f:id:cross_hyou:20191025070946j:plain

今回は以上です。