Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の消費者物価指数・教養娯楽のデータの分析6 - R言語でRidge Regressionをする

 

www.crosshyou.info

 の続きです。

今回はRidge Regressionをしてみます。

 

 を参考にしています。

まず、glmnetパッケージの読み込みをします。

f:id:cross_hyou:20210503080927p:plain

glmnet関数は説明変数のマトリックスと被説明変数のベクトルを用意しないといけないので、マトリックス、ベクトルを作ります。

f:id:cross_hyou:20210503081907p:plain

glmnet関数でRidge Regressionモデルを作成します。

f:id:cross_hyou:20210503082054p:plain

lambdaによって係数がどのように変わるかを図示してみます。

f:id:cross_hyou:20210503082438p:plain

f:id:cross_hyou:20210503082500p:plain

cv.glmnet関数で最適なlambdaの値でのRidge Regression Modelを作ります。

f:id:cross_hyou:20210503082848p:plain

plot関数でCvRidgeModをグラフにすると、最適なlamdaがどこかわかります。

f:id:cross_hyou:20210503083145p:plain

f:id:cross_hyou:20210503083200p:plain

lambda.minという名前で最適なlambdaが格納されています。

f:id:cross_hyou:20210503083354p:plain

各変数の係数を確認しましょう。

f:id:cross_hyou:20210503084946p:plain

普通のlm関数のモデルの係数も見てみましょう。

f:id:cross_hyou:20210503085154p:plain

今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには、

 

www.crosshyou.info

 です。