crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

全国主要都市の交通事故と犯罪発生件数のデータ分析4- R言語のggplot2パッケージのgeom_point関数で散布図を描く。

 

www.crosshyou.info

 の続きです。

今回は、R言語のggplot2パッケージのgeom_point関数で散布図を描いてみます。

まずは、単純にkoutuu(人口10万人当りの交通事故件数)とkeihou(人口千人当りの刑法犯認知件数)です。

f:id:cross_hyou:20201204210140p:plain

まず、あとでいろいろな観点からkoutuuとkeihouの散布図を見るために、基本の散布図のオブジェクト、pを作ります。scale_x_log10()とscale_y_log10()でX軸, Y軸は対数目盛にしました。theme(legend.position = "none")で凡例を表示しないようにしました。

それと、geom_smooth(method = "lm")をつけて回帰直線を描くようにしました。

この結果が以下の散布図です。

f:id:cross_hyou:20201204210440p:plain

回帰線が右肩上がりになっていることから、koutuuとkeihouは正の相関関係があることがわかります。

この散布図に第3の要素を加えていきます。

まずは、yearです。

f:id:cross_hyou:20201204210651p:plain

f:id:cross_hyou:20201204210709p:plain

facet_warp関数を使うとこのように年ごとの散布図になります。2000年と2005年が大きな外れ値があることがわかります。

 

次は、regionです。

f:id:cross_hyou:20201204210852p:plain

f:id:cross_hyou:20201204210922p:plain

関東に大きな外れ値があることは前回の分析でもわかりましたが、このグラフでもわかりますね。四国なんかはこじんまりとしています。

 

次は、eastwest(東日本と西日本)です。

f:id:cross_hyou:20201204211126p:plain

f:id:cross_hyou:20201204211143p:plain

東日本のほうが大きな値がありますね。

 

次は、japanpacificです。

f:id:cross_hyou:20201204211356p:plain

f:id:cross_hyou:20201204211340p:plain

その他(海の無い県や青森県や兵庫県、山口県のように日本海にも太平洋にも面している県)が件数が少ないです。

今回は以上です。