Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の1住宅当たり延べ面積のデータの分析3 - R言語でヒストグラムや散布図を描く。

 

www.crosshyou.info

の続きです。

今回はR言語でヒストグラムや散布図を描いてみます。

まずは、nobe: 1住宅当たり延べ面積(m2)のヒストグラムです。

f:id:cross_hyou:20210228174050p:plain

f:id:cross_hyou:20210228174110p:plain

facet_grid()をつかって年度ごとにヒストグラムを描きました。年度による違いはあまりないようですね。

次は、mitudo: 人口密度(1ha当たり人口)です。

f:id:cross_hyou:20210228174317p:plain

f:id:cross_hyou:20210228174330p:plain

人口密度も年度による違いはなさそうです。値の大きいところが3つあります。

次は、per_capita17: 1人当り県内総生産額(平成17年基準、百万円)です。

f:id:cross_hyou:20210228174539p:plain

f:id:cross_hyou:20210228174554p:plain

値の大きなところが一つあります。年度による違いはあまりないです。

per_setai: 1世帯当たり人数のヒストグラムはどうでしょうか?

f:id:cross_hyou:20210228174725p:plain

 

f:id:cross_hyou:20210228174741p:plain

1人当たりの世帯人数は年をへるごとに減少しているように見えます。

年によって1世帯当たり人数に違いがあるかどうか、ANOVA分析で確認しましょう。

f:id:cross_hyou:20210228200033p:plain

p値は5.62e-07と0.05よりも小さいです。やはり年によってper_setaiは値が違います。

 

都道府県別のグラフも描いてみます。まずはnobeから

f:id:cross_hyou:20210228200215p:plain

f:id:cross_hyou:20210228200258p:plain

富山県、福井県、山形県などが面積が広く、東京都、大阪府、神奈川県などがせまいです。

mitsudoはどうでしょうか?

f:id:cross_hyou:20210228200500p:plain

f:id:cross_hyou:20210228200512p:plain

東京都がダントツで、神奈川県、埼玉県と続きます。北海道、秋田県、岩手県が人口密度が低いです。

 

per_capita17をみてみましょう。

f:id:cross_hyou:20210228200654p:plain

f:id:cross_hyou:20210228200721p:plain

東京都がこちらも飛びぬけています。愛知県、大阪府と続きます。

奈良県、沖縄県、埼玉県が少ないです。

per_setaiはどうでしょうか?

f:id:cross_hyou:20210228201107p:plain

f:id:cross_hyou:20210228201120p:plain

per_setaiは調査年度ではっきりと違いがありましたから、色分けしてみました。
山形県、福井県、佐賀県が人数が多く、東京都、北海道、大阪府が人数が少ないです。

 

続いて、各変数間の相関関係を調べてみましょう。nobeと相関が一番強いのはどこでしょうか?

f:id:cross_hyou:20210228201345p:plain

nobeと一番相関の強いのはper_setaiです。1世帯当たりの人数が多ければ家の面積も広い、というのは納得感があります。

以外なのは、per_capita17とnobeが-0.161とマイナス相関なことです。1人当たりの県内総生産額が増えれば広い家に住めると思うのですけどね。。

nobeとmitsudoの散布図を描いてみます。

f:id:cross_hyou:20210228201915p:plain

f:id:cross_hyou:20210228201931p:plain

geom_smooth(method = "lm") を加えて、回帰直線を重ねました。

人口密度が高いほど、1住宅当たりの延べ面積は狭くなります。

 

f:id:cross_hyou:20210228202240p:plain

f:id:cross_hyou:20210228202254p:plain

per_capita17ですが、右下の3つので点、東京都の影響でマイナスの相関になっているような気がします。東京都抜きで散布図を描いてみます。

f:id:cross_hyou:20210228202628p:plain

f:id:cross_hyou:20210228202644p:plain

やっぱりそうですね。東京都抜きだと回帰直線の傾きが右肩上がりになりました。

回帰分析するときは東京都をダミー変数として加えたほうがいいかもですね。

nobeとper_setaiの散布図を見ましょう。

f:id:cross_hyou:20210228203030p:plain

f:id:cross_hyou:20210228203047p:plain

per_setaiの値が大きいほど、nobeの値が大きいというのがはっきりわかります。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

 

はじめから読むには、

 

www.crosshyou.info

 です。