の続きです。
今回は、R言語のggplot2パッケージのgeom_point関数で散布図を描いてみます。
まずは、単純にkoutuu(人口10万人当りの交通事故件数)とkeihou(人口千人当りの刑法犯認知件数)です。
まず、あとでいろいろな観点からkoutuuとkeihouの散布図を見るために、基本の散布図のオブジェクト、pを作ります。scale_x_log10()とscale_y_log10()でX軸, Y軸は対数目盛にしました。theme(legend.position = "none")で凡例を表示しないようにしました。
それと、geom_smooth(method = "lm")をつけて回帰直線を描くようにしました。
この結果が以下の散布図です。
回帰線が右肩上がりになっていることから、koutuuとkeihouは正の相関関係があることがわかります。
この散布図に第3の要素を加えていきます。
まずは、yearです。
facet_warp関数を使うとこのように年ごとの散布図になります。2000年と2005年が大きな外れ値があることがわかります。
次は、regionです。
関東に大きな外れ値があることは前回の分析でもわかりましたが、このグラフでもわかりますね。四国なんかはこじんまりとしています。
次は、eastwest(東日本と西日本)です。
東日本のほうが大きな値がありますね。
次は、japanpacificです。
その他(海の無い県や青森県や兵庫県、山口県のように日本海にも太平洋にも面している県)が件数が少ないです。
今回は以上です。