Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

UCI Machine Learning Repository の Bank Marketing のデータの分析6 - k-Nearest Neighbors 法で予測

(Bing Image Creator で生成: プロンプト: Landscape of pink and white Spiranthes sinensis var. amoena, background is rock mountains, photo)

 

www.crosshyou.info

の続きです。

今回は、k-Nearest Neighbors 法で予測します。

class パッケージの読み込みをしましょう。

そして、knn()関数で予測します。

とりあえず、k = 5 でやってみました。

どのくらいの予測精度でしょうか?

Accuracy, 正解率は 0.8894 と前回の Linear Probability Model よりは下がりましたが、Balanced Accuracy は 0.6134 と上がりました。

忘れないように、結果を保存しておきます。

今回は以上です。

次回は

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 第2の予測
# k-nearest neighbors 法での予測
#
# class パッケージの読み込み
library(class)
#
# k = 5 のとき
knn_k5 <- knn(df_train[ , -1], df_test[ , -1], df_train$yes, k = 5)
#
# k = 5 のときの成績
confusionMatrix(knn_k5, factor(df_test$yes))
#
# 第1のモデルと第2のモデルの成績を格納
estimates_results <- tibble(
  model = c("lpm", "knn"),
  accuracy = c(0.8936, 0.8894),
  b_accuracy = c(0.5772, 0.6134)
)
estimates_results
#