Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

小売物価統計調査のデータ分析3 - R言語のlm()関数で単回帰分析。マニュアル計算でも切片と傾きを求める。

f:id:cross_hyou:20220408212458j:plain

Photo by Simon Berger on Unsplash 

www.crosshyou.info

の続きです。

前回はいろいろなグラフを作成しました。今回は分析的なことをしてみましょう。

まず、sougou: 総合物価指数と他の種類の物価の相関を調べてみます。

f:id:cross_hyou:20220408212946p:plain

一番相関が無いのは、utility: 光熱・水道で、一番相関があるのは、ex_rent: 家賃を除く総合です。家賃を除く総合が総合と相関が高いのは当りまえなので、実質的に一番相関が高いのは、house: 住居です。

そこで、utility: 光熱・水道とhouse: 住居とsougou: 相互の3つについて調べてみましょう。

house: 住居とsougou: 総合の散布図を描いてみます。

f:id:cross_hyou:20220408213503p:plain

f:id:cross_hyou:20220408213514p:plain

house: 住居とsougou: は高い相関があることがわかります。

utility: 光熱・水道とsougou: の散布図を描いてみます。

f:id:cross_hyou:20220408213818p:plain

f:id:cross_hyou:20220408213829p:plain

こちらは相関が無いことがわかります。

次にlm()関数で回帰分析をしてみます。

f:id:cross_hyou:20220408214000p:plain

sougou: 総合を被説明変数に、house: 住居を説明変数にして回帰分析をしました。

house: 住居の係数は0.137でp値はほとんど0なので有意な係数です。

house: 住居の値が1増えると、sougou: 総合の値が0.137増える、ということです。

次は、説明変数にutility: 光熱・水道を使って回帰分析をしてみます。

f:id:cross_hyou:20220408214257p:plain

utility: 光熱・水道の係数は-0.015とかなり小さく、p値は0.299と0.05よりも大きいので有意な係数ではないです。utility: 光熱・水道の水準とは無関係にsougou: 総合の値は決まっているようです。

lm()関数を使えば、回帰モデルの切片や傾きは自動的に計算してくれます。

これをマニュアルで算出してみます。

説明変数が1つの場合の単回帰モデルでは、傾きの式は、

傾き = yとxの共分散 / xの分散

です。

house: 住居を説明変数にしたときの傾きを算出してみます。

f:id:cross_hyou:20220408215548p:plain

0.137となりました。これは、lm()関数で求めた傾きと一致しています。

切片の式は、

切片 = yの平均値 - 傾き*xの平均値

です。

傾きは0.1372686とわかりましたので、切片を算出してみます。

f:id:cross_hyou:20220408220048p:plain

86.25となりました。これは、lm()関数で求めた切片と一致しています。

今回は以上です。

次回は

 

www.crosshyou.info

です。

初めから読むには、

 

www.crosshyou.info

です。