crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のエンゲル係数のデータの分析4 - R言語でエンゲル係数とその他の変数の関係を調べる。散布図と相関係数。

 

www.crosshyou.info

 の続きです。

今回は、engel: エンゲル係数と各変数の関係を見ていきます。

まずは、gdp_pop: 1人当たりの県内総生産額(平成17年基準)【百万円】からです。

f:id:cross_hyou:20210307174108p:plain

f:id:cross_hyou:20210307174124p:plain

geom_smooth(method = "lm")を加えて、線形回帰分析の回帰直線を重ねています。

右端の3つので点、東京都の影響が大きく回帰直線に作用しているようです。

東京都を除いて散布図を描いてみます。

f:id:cross_hyou:20210307174628p:plain

f:id:cross_hyou:20210307174647p:plain

相関はなさそうな散布図ですね。

次は、mf: 男女比率との散布図をみてみましょう

f:id:cross_hyou:20210307174922p:plain

f:id:cross_hyou:20210307174938p:plain

正の相関があるようですが、強い相関ではなさそうです。

working: 15~64歳人口割合との散布図をみてみます。

f:id:cross_hyou:20210307175243p:plain

f:id:cross_hyou:20210307175257p:plain

これも正の相関があるようです。

log_gdp_pop: 対数変換した1人当たりの県内総生産額とも散布図を描きます。

f:id:cross_hyou:20210307175640p:plain

f:id:cross_hyou:20210307175658p:plain

gdp_popと同じように右端の3つの点、東京都の影響が大きそうですね。

東京都を除いてみます。

f:id:cross_hyou:20210307180056p:plain

f:id:cross_hyou:20210307180112p:plain

回帰直線がほとんど水平線ですね。

相関係数マトリックスをみてみます。

f:id:cross_hyou:20210307180708p:plain

engelとの相関で見ると、男女比率と15~64歳人口割合は予想通り値が大きいほどエンゲル係数が高いという相関になっています。生活水準を表すgdp_pop, log_gdp_popがプラスの相関なので予想とは違っています。

東京都を除いて相関係数マトリックスをみてみましょう。

f:id:cross_hyou:20210307181137p:plain

engelとgdp_pop, log_gdp_popの相関は低くなりました。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。