www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の建築物リフォーム・リニューアル調査のデータ分析2 - データをヒストグラムにして分布を可視化する。

UnsplashMarek Piwnickiが撮影した写真 

www.crosshyou.info

の続きです。前回はデータをRに読み込ませるところまでやりました。

そして、shotoku17: 平成17年基準の県民1人当たり所得のデータはすべてNAであることがわかりました。なので、shotoku17は削除しておきます。

今回はデータをグラフにして、どんな様子のデータなのかをみてみます。

はじめは、total: リフォーム・リニューアルの合計金額ですね。

ggplotパッケージを使ってヒストグラムにしてみます。

geom_histogram()でヒストグラムにしました。さらに、facet_wrap()で年度ごとにしてみました。右に外れ値のように大きな値の観測があります。

totalは、対数変換したほうが正規分布に近くなりそうですね。

こんどは、このl_totalでヒストグラムにしてみます。

こちらのほうが分布の形状がわかりやすいですね。2016年度、2017年度、2018年度とだんだんと左側に分布が移動しているような気がします。

次は、house: 住宅のリフォーム・リニューアルの金額です。これも対数変換してからヒストグラムにしてみます。

住宅はトータルほどには右側の外れ値は目立たないですね。こちらもだんだんと左に分布が動いているように思われます。

次は、nohouse: 住宅以外のリフォーム・リニューアルの金額のヒストグラムです。前の二つと同じく対数変換値を作成してヒストグラムにしてみます。

住宅以外のリフォーム・リニューアルの金額の分布も左方向に移動、つまり金額が減少しているように見えます。

続いて、shotoku23: 平成23年基準の1人当たり所得をヒストグラムにしてみます。これも対数変換値を作成してからヒストグラムにしてみます。

1人当たり所得は対数変換値を作成しても右側に外れ値がありますね。

houseとnohouseの比率を作成して、それのヒストグラムもみてみます。

house/nohouseの比率をratioと名付けました。ヒストグラムを見ると、1以上の観測値もあります。住宅のリフォーム・リニューアルの金額ののほうが多い都道府県があるということですね。
今回は以上です。

次回は、

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

 

です。