www.crosshyou.infoのの続きです。
今回は、R言語でRegression trees分析をします。
treeパッケージの中のtree関数を使いますので、はじめにtreeパッケージを読み込みます。
そして、tree関数でRegression treeモデルを作ります。
summary関数で結果を見てみましょう。
Popu, perGDP, Chuu, Kouの4つの変数がモデルに使われたようです。
print関数でモデルを表示してみます。
上のような結果が出力されます。
2) Popu < 0.3994457とありますので、Popuが0.394457よりも大きいか小さいかでRegression treeの枝が分かれています。
グラフにしたほうがわかりやすいので、plot関数とtext関数を使います。
これだとわかりますね。
MSEを計算しましょう。
MSEは0.01440608です。いままでのモデルの中で一番小さいです。
他のモデルと比較してみます。
GAMモデルよりも小さいMSEです。
実際の値と予測値の散布図を描きます。
Regression treeモデルだと予測された値は、それぞれの枝の先の値になりますから、予測値は6種類しかないですね。
今回は以上です。