www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の事業所数(民営)のデータ分析5 - R言語のrlm関数でrobust linear regression

 

www.crosshyou.info

 の続きです。

前回はlm関数で1人当りの課税所得を予測しました。

今回はMASSパッケージのrlm関数でrobust linear regression modelで予測してみようと思います。

library(MASS)でMASSパッケージを読み込みます。

f:id:cross_hyou:20200516095740j:plain

使い方はlm関数と同じです。

f:id:cross_hyou:20200516095840j:plain

t valueのところを見ると、Yearは0.1095と2よりも小さいので有意でないですね。

このrlm1と名付けたモデルでperIncを予測します。

predict関数を使います。

f:id:cross_hyou:20200516100026j:plain

MSEを計算します。

f:id:cross_hyou:20200516100113j:plain

0.01374251です。前回のlm関数で作成したモデル、lm1, lm2よりも大きなMSEです。

Yearを削除したモデルも作ります。

f:id:cross_hyou:20200516100339j:plain

こちらでも予測してみます。

f:id:cross_hyou:20200516100427j:plain

MSEを計算します。

f:id:cross_hyou:20200516100514j:plain

rlm1よりも少し値が大きくなりました。

rlm1で予測した値と、実際の値、lm1で予測した値を散布図にしてみます。

f:id:cross_hyou:20200516101314j:plain

f:id:cross_hyou:20200516101327j:plain

赤い丸がrlm関数で予測した値、青い三角がlm関数で予測した値です。

今回は以上です。