UnsplashのZoe Schaefferが撮影した写真
の続きです。前回はヒストグラムで一つの変数の分布をグラフにしてみました。
今回は、散布図で二つの変数の関係性をグラフにしてみます。
まずは、l_shotoku23とl_totalです。
l_shotoku23が大きいと、l_totalも大きいという正の相関関係が見られます。
次は、l_shotoku23とratioをみてみます。
あんまり相関はない感じです。
l_totalとratioをみてみます。
これもあまり相関は無いようです。
cor()関数で相関係数をみてみます。
l_shotoku23とl_totalの相関係数は、0.65, l_shotoku23とratioは-0.117, l_totalとratioは-0.067となっています。
l_shotoku23のtop5をみてみます。
top5といっても2016年度、2017年度、2018年度の3つの年度があるので、上位15の観測を表示しています。東京都、愛知県、栃木県、静岡県、富山県、滋賀県、茨城県が表示されました。top_n()関数で上位15の観測だけにして、arrange(desc())関数で大きい順に表示しています。
bottom5も表示してみます。
沖縄県、鳥取県、宮崎県、鹿児島県、奈良県、青森県が表示されました。top_n()関数で、top_n(-15, l_shotoku23)のようにマイナスの数字を入れると、小さいほうの観測をとってきます。
l_totalのtop5をみてみます。
東京都、神奈川県、愛知県、大阪府、北海道、埼玉県がランクインしました。
bottom5をみてみます。
高知県、沖縄県、奈良県、島根県、佐賀県、大分県、鳥取県、和歌山県、山梨県が表示されました。
ratioのtop5を見てみます。
島根県、岡山県、岩手県の3県がratioが1.0以上のときがありました。この3県と宮崎県、福井県、大分県、兵庫県、埼玉県、神奈川県、鳥取県、和歌山県、福岡県が表示されました。
ratioのbottom5をみてみます。
徳島県、沖縄県、佐賀県、山梨県、栃木県、静岡県、群馬県、福井県、茨城県、福島県、香川県が表示されました。これらの県は、住宅のリフォーム・リニューアルの金額よりも、非住宅のリフォーム・リニューアルの金額のほうがうんと多いということですね。
今回は以上です。
次回は、
初めから読むには、
です。