UnsplashのMarek Piwnickiが撮影した写真
の続きです。前回はデータをRに読み込ませるところまでやりました。
そして、shotoku17: 平成17年基準の県民1人当たり所得のデータはすべてNAであることがわかりました。なので、shotoku17は削除しておきます。
今回はデータをグラフにして、どんな様子のデータなのかをみてみます。
はじめは、total: リフォーム・リニューアルの合計金額ですね。
ggplotパッケージを使ってヒストグラムにしてみます。
geom_histogram()でヒストグラムにしました。さらに、facet_wrap()で年度ごとにしてみました。右に外れ値のように大きな値の観測があります。
totalは、対数変換したほうが正規分布に近くなりそうですね。
こんどは、このl_totalでヒストグラムにしてみます。
こちらのほうが分布の形状がわかりやすいですね。2016年度、2017年度、2018年度とだんだんと左側に分布が移動しているような気がします。
次は、house: 住宅のリフォーム・リニューアルの金額です。これも対数変換してからヒストグラムにしてみます。
住宅はトータルほどには右側の外れ値は目立たないですね。こちらもだんだんと左に分布が動いているように思われます。
次は、nohouse: 住宅以外のリフォーム・リニューアルの金額のヒストグラムです。前の二つと同じく対数変換値を作成してヒストグラムにしてみます。
住宅以外のリフォーム・リニューアルの金額の分布も左方向に移動、つまり金額が減少しているように見えます。
続いて、shotoku23: 平成23年基準の1人当たり所得をヒストグラムにしてみます。これも対数変換値を作成してからヒストグラムにしてみます。
1人当たり所得は対数変換値を作成しても右側に外れ値がありますね。
houseとnohouseの比率を作成して、それのヒストグラムもみてみます。
house/nohouseの比率をratioと名付けました。ヒストグラムを見ると、1以上の観測値もあります。住宅のリフォーム・リニューアルの金額ののほうが多い都道府県があるということですね。
今回は以上です。
次回は、
です。
初めから読むには、
です。