www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

UCI の Adult データの分析5 - R の FNN パッケージで、k-nearest neighbors での Classification



Generated by Bing Image Creator: 広い野原に小川と小道があって、菜の花がいっぱい咲いていて、空は青空の写真

www.crosshyou.info

の続きです。

今回は、R の FNN パッケージで、k-nearest neighbors での分類をします。

まずは、FNN パッケージの読み込みをします。

k-nearest neighbors のパラメータは k ですが、最適な k を求めるために、mtx_train をさらにトレーニング用、テスト用のデータにわけます。

for loop で前回にように最適な k を求めます。

for loop が私の PC(Thinkbook 15-IIL) だと 10分ぐらいかかりました。

correct_boxのグラフをみます。

correct じゃなくて、collect とすべきでした。

k = 40 より大きい値がいいようですね。

best_k は 40でした。 k は奇数のほうがいいので、グラフをみると、39のほうが41よりもよさそうなので、k = 39 でやってみます。

成果率は、82.9% でした。

今回は以上です。

次回は、

www.crosshyou.info

です。

初めから読むには、

www.crosshyou.info

です。