crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の事業所数(民営)のデータ分析5 - R言語のrlm関数でrobust linear regression

 

www.crosshyou.info

 の続きです。

前回はlm関数で1人当りの課税所得を予測しました。

今回はMASSパッケージのrlm関数でrobust linear regression modelで予測してみようと思います。

library(MASS)でMASSパッケージを読み込みます。

f:id:cross_hyou:20200516095740j:plain

使い方はlm関数と同じです。

f:id:cross_hyou:20200516095840j:plain

t valueのところを見ると、Yearは0.1095と2よりも小さいので有意でないですね。

このrlm1と名付けたモデルでperIncを予測します。

predict関数を使います。

f:id:cross_hyou:20200516100026j:plain

MSEを計算します。

f:id:cross_hyou:20200516100113j:plain

0.01374251です。前回のlm関数で作成したモデル、lm1, lm2よりも大きなMSEです。

Yearを削除したモデルも作ります。

f:id:cross_hyou:20200516100339j:plain

こちらでも予測してみます。

f:id:cross_hyou:20200516100427j:plain

MSEを計算します。

f:id:cross_hyou:20200516100514j:plain

rlm1よりも少し値が大きくなりました。

rlm1で予測した値と、実際の値、lm1で予測した値を散布図にしてみます。

f:id:cross_hyou:20200516101314j:plain

f:id:cross_hyou:20200516101327j:plain

赤い丸がrlm関数で予測した値、青い三角がlm関数で予測した値です。

今回は以上です。