Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

UCI の Automobile のデータの分析6 - R の randomForest() 関数でランダムフォレストで symboling を予測する

Bing Image Creator で生成: Close-up of Phalaenopsis orchid, blue coral reef in background, photo

 

www.crosshyou.info

の続きです。

今回は R の randaomForest パッケージで、ランダムフォレストを使って予測をします。

まず、パッケージを読み込みます。

モデルをフィットします。

予測します。

結果をみてみます。

正解率を計算します。

71.9% という今までの予測方法の中で一番高い正解率ですね。さすがランダムフォレストです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下のとおりです。

# ランダムフォレスト
library(randomForest)
#
# モデル
rf_mod <- randomForest(symboling ~ ., data = df_train)
#
# 予測
yosoku_rf <- predict(rf_mod, newdata = df_test) |> round(0)
#
# 結果
table(yosoku_rf, df_test$symboling)
#
# 正解率
accu_rf <- (10 + 13 + 17 + 6) / 64
accu_rf
#