今回は都道府県別の凶悪犯認知件数を分析します。
e-stat, 政府統計の総合窓口からデータを取得しました。

説明変数として、総人口、可住地面積、県内総生産額も一緒に取得しました。

このようなExcelファイルを作成しました。これをread.csv関数でR言語に読込ませ分析します。

Badが凶悪犯認知件数です。一番少なくて12件、多くて1255件、平均値は163件、中央値は66件です。平均値と中央値に大きな差がありますね。偏りのあるデータ分布なのでしょう。グラフにしてみてみます。

まず、gpという名前の3つのグラフを描く自作関数を作成しました。


ヒストグラムの分布の形状を見ると、右側に裾野が広がっている形状です。
年度を見てみましょう。

2006年度から2015年度までの10年間のデータがあることがわかります。
1975年度などの不要なファクタ水準を削除します。

全ての年度でデータが47個あるので、47都道府県すべてのデータが揃っている。ということですね。
都道府県ごとの過去10年間の平均の人口、可住地面積、県内総生産、凶悪犯認知件数を作成します。

人口は鳥取県が一番少ないです。多いのは東京です。

可住地面積の一番狭いのは奈良県なんですね。一番広いのは北海道です。

県内総生産が一番少ないのは、鳥取県です。一番多いのは東京都です。

凶悪犯認知件数が一番少ないのは島根県です。一番多いのは大阪府です。
このavgBadのグラフを見てみましょう。


今回は以上です。