www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

失業率・第3次産業活動指数・消費者物価指数の時系列データ分析7 - ランダムフォレストのほうが線形回帰OLSより良い結果になるとは限らない。

Bing Image Creator で生成:Landscape, natural rural area forest, photo

 

www.crosshyou.info

の続きです。

前回は、線形モデルをOLSで推計して第3次産業活動指数を予測しました。

今回はランダムフォレストでモデルを推計して予測してみましょう。

まず、ランダムフォレストのモデルとエンジンを設定します。

レシピは、前回のものをそのまま使用できます。

ワークフローを設定します。

次は fit() 関数でパラメータを推定しモデルを特定します。

predict() 関数で、df_test データから dai3ji を予測します。

RMSEを計算してみましょう。OLSでの予測結果よりも小さなRMSEになるでしょうか?

5.88 でした。

OLSでの予測のRMSEは 5.36 でしたので、ランダムフォレストによる予測よりも、OLSの線形回帰のほうが成績がいいですね。

今回は以上です。

 

初めから読むには、

www.crosshyou.info

です。