Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の凶悪犯認知件数の分析4 - R言語で可住地面積当りの凶悪犯認知件数を計算。度数分布表を出力する関数を作成。

 

www.crosshyou.info

 の続きです。

今回は可住地面積当りの凶悪犯認知件数を計算してみます。

f:id:cross_hyou:20191102143405p:plain

10万ha当りの件数を算出しました。秋田県は8.4件、大阪府は780.5件です。100倍近い差がありますね。

グラフで分布をみてみます。

f:id:cross_hyou:20191102143729p:plain

f:id:cross_hyou:20191102143714p:plain

 

大きな値に外れ値がいっぱいあることがわかります。

summary関数で平均値などを見てみます。

f:id:cross_hyou:20191102143928p:plain

平均値は35.5で中央値は85です。

今回は、度数分布表を作成する関数を作ろうと思います。

参考図書は

 

現場ですぐに使える!  R言語プログラミング逆引き大全 350の極意

現場ですぐに使える! R言語プログラミング逆引き大全 350の極意

 

 です。

ヒストグラムを作成する関数histはただヒストグラムを描くだけでなくていろいろなデータも同時に計算しています。

f:id:cross_hyou:20191102144726p:plain

f:id:cross_hyou:20191102144738p:plain

$breaksがヒストグラムの階級で、$countが度数です。これを利用します。

f:id:cross_hyou:20191102151625p:plain
こんな感じです。

それでは関数を実行してみます。

f:id:cross_hyou:20191102151646p:plain

 

f:id:cross_hyou:20191102151711p:plain

ヒストグラムも出力するようになっています。

度数分布表を見ると38都道府県、8割の都道府県が100件以下に入っています。

この38件の分布を詳しく見てみましょう。

f:id:cross_hyou:20191102152239p:plain

f:id:cross_hyou:20191102152255p:plain


BadArea[BadArea < 100]とすると、100件以下の都道府県だけに絞り込むことができます。

100件以下の都道府県にすると山型に近い分布になりますね。

今回は以上です。