の続きです。前回はlm関数で男性か女性かを分類するモデルを作りました。正解率は88%でした。
今回はknn3関数でk-nearest neighborsモデルを作り、同じようにやってみます。
まず。knn3関数はcaretパッケージにあるので、caretパッケージを読み込みます。
k = 5は初期設定と同じです。5個のデータでの距離を計算していく、ということですね。
predict関数で予測値を算出します。
table関数で実際の値と比べましょう
正解率を計算します。
正解率は64%です。lm関数で予測したモデルよりも低いですね。
K = 10 にして同じことをしてみます。
正解率を計算してみます。
62%です。よくないですね。
kを2~30までにして正解率を計算してみましょう。sapply関数をつかって、いっぺんにやります。
一番高い正解率とそのときのkは何でしょうか?
k = 14のとき正解率が68%で最高でした。
今回は以上です。
次回は
です。
はじめから読むには、
です。