www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の旅行・行楽の年間行動者率のデータの分析6 - R言語のgam関数でGeneralized Additive Modelで回帰分析

 

www.crosshyou.info

 今回はGeneralized Additive Modelで回帰分析をします。

まず、mgcvパッケージの読み込みからです。

f:id:cross_hyou:20210116154633p:plain

gam関数でGeneralized Additive Modelによる回帰分析を実行します。

f:id:cross_hyou:20210116154759p:plain

R-sq.(adj)が0.796となっています。k = 3はパラメータなのですが、何のパラメータなのかわかっていないです。すみません。the k value that is the dimension of the basis  used to represent the smooth term.とRegression Analysis with R by Giuseppe Ciaburroにありました。平滑化で使われる次元だそうです。

gam.check関数でモデルのチェックができます。

f:id:cross_hyou:20210116160648p:plain

f:id:cross_hyou:20210116160732p:plain

low p-value (k - index <1) may  indicate that k is too low とありますので、kを4にしてみます。

f:id:cross_hyou:20210116161044p:plain

R-sq.(adj)が0.799とgam_model1よりも高くなりました。

gam.check関数でチェックします。

f:id:cross_hyou:20210116161321p:plain

f:id:cross_hyou:20210116161337p:plain

まだ k - indexが1より小さいですね。k = 5にしてみます。

f:id:cross_hyou:20210116161746p:plain

あら、k = 5 だとエラーになってしまいますね。

k= 4でいいのですね。

gam_model2をグラフにしてみます。

f:id:cross_hyou:20210116162038p:plain

f:id:cross_hyou:20210116162053p:plain

AIC関数でlm_model3とgam_model2のどちらがAICが小さいか比べてみます。

f:id:cross_hyou:20210116162252p:plain

gam_model2のほうがAICの値が小さいので良いモデルです。

残差プロットを描きましょう。

f:id:cross_hyou:20210116162440p:plain

f:id:cross_hyou:20210116162454p:plain

gam_model2のほうが残差が小さいことがわかります。

散布図と回帰曲線を描きます。

f:id:cross_hyou:20210116162624p:plain

まずplot関数とpoints関数で散布図を描きました。

f:id:cross_hyou:20210116162715p:plain

これに回帰曲線をのせていきます。

f:id:cross_hyou:20210116162838p:plain

f:id:cross_hyou:20210116162853p:plain

今回は以上です。

はじめから読むには、

 

www.crosshyou.info

 です。