今回は都道府県別の凶悪犯認知件数を分析します。
e-stat, 政府統計の総合窓口からデータを取得しました。
説明変数として、総人口、可住地面積、県内総生産額も一緒に取得しました。
このようなExcelファイルを作成しました。これをread.csv関数でR言語に読込ませ分析します。
Badが凶悪犯認知件数です。一番少なくて12件、多くて1255件、平均値は163件、中央値は66件です。平均値と中央値に大きな差がありますね。偏りのあるデータ分布なのでしょう。グラフにしてみてみます。
まず、gpという名前の3つのグラフを描く自作関数を作成しました。
ヒストグラムの分布の形状を見ると、右側に裾野が広がっている形状です。
年度を見てみましょう。
2006年度から2015年度までの10年間のデータがあることがわかります。
1975年度などの不要なファクタ水準を削除します。
全ての年度でデータが47個あるので、47都道府県すべてのデータが揃っている。ということですね。
都道府県ごとの過去10年間の平均の人口、可住地面積、県内総生産、凶悪犯認知件数を作成します。
人口は鳥取県が一番少ないです。多いのは東京です。
可住地面積の一番狭いのは奈良県なんですね。一番広いのは北海道です。
県内総生産が一番少ないのは、鳥取県です。一番多いのは東京都です。
凶悪犯認知件数が一番少ないのは島根県です。一番多いのは大阪府です。
このavgBadのグラフを見てみましょう。
今回は以上です。