Photo by Simon Berger on Unsplash
の続きです。
前回はいろいろなグラフを作成しました。今回は分析的なことをしてみましょう。
まず、sougou: 総合物価指数と他の種類の物価の相関を調べてみます。
一番相関が無いのは、utility: 光熱・水道で、一番相関があるのは、ex_rent: 家賃を除く総合です。家賃を除く総合が総合と相関が高いのは当りまえなので、実質的に一番相関が高いのは、house: 住居です。
そこで、utility: 光熱・水道とhouse: 住居とsougou: 相互の3つについて調べてみましょう。
house: 住居とsougou: 総合の散布図を描いてみます。
house: 住居とsougou: は高い相関があることがわかります。
utility: 光熱・水道とsougou: の散布図を描いてみます。
こちらは相関が無いことがわかります。
次にlm()関数で回帰分析をしてみます。
sougou: 総合を被説明変数に、house: 住居を説明変数にして回帰分析をしました。
house: 住居の係数は0.137でp値はほとんど0なので有意な係数です。
house: 住居の値が1増えると、sougou: 総合の値が0.137増える、ということです。
次は、説明変数にutility: 光熱・水道を使って回帰分析をしてみます。
utility: 光熱・水道の係数は-0.015とかなり小さく、p値は0.299と0.05よりも大きいので有意な係数ではないです。utility: 光熱・水道の水準とは無関係にsougou: 総合の値は決まっているようです。
lm()関数を使えば、回帰モデルの切片や傾きは自動的に計算してくれます。
これをマニュアルで算出してみます。
説明変数が1つの場合の単回帰モデルでは、傾きの式は、
傾き = yとxの共分散 / xの分散
です。
house: 住居を説明変数にしたときの傾きを算出してみます。
0.137となりました。これは、lm()関数で求めた傾きと一致しています。
切片の式は、
切片 = yの平均値 - 傾き*xの平均値
です。
傾きは0.1372686とわかりましたので、切片を算出してみます。
86.25となりました。これは、lm()関数で求めた切片と一致しています。
今回は以上です。
次回は
です。
初めから読むには、
です。