Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

UCI Machine Learning Repository の Raisin のデータ分析6 - ニューラルネットワークによる判別、正解率は86.3%

Bing Image Creator で生成: Wideshot view of Japanese forest, photo

www.crosshyou.info

の続きです。

今回は、Rのnnetパッケージでニューラルネットワークによる判別をしてみます。

まずは、nnetパッケージを読み込みます。

nnet()関数でニューラルネットワークのモデルをフィットします。

size = 3 としていますが、これはニューラルネットワークの隠れ階層が3ということです。

predict()関数で予測します。

結果をみてみましょう。

正解率を計算します。

86.3%でした。今までの中で一番高い正解率でした。

Confusion Matrixも作成しておきます。

今回で UCI Machine Learning Repository の Raisin のデータでの判別は終わりにしようと思います。

いろいろな手法をたしかめました。

デタラメ判別は、56%

決定木モデルは、83%

サポートベクターマシーンは、84%

LASSO回帰は、83.7%

ニューラルネットワークは、86.3%

でした。

決定木モデルとLASSO回帰は、どうやって判別したのかがわかるけど、サポートベクターマシーンとニューネットワークはわからない。

決定木モデルとLASSO回帰は正解率がサポートベクターマシーン、ニューラルネットワークよりは低い。

という結果でした。

決定木モデルとLASSO回帰は正解率は低いですが、とても低いということではなくて、今回くらいの差であれば、どうやって判別したかわかるこの2つの方法のほうがいいのかな?と思いました。

初めから読むには、

www.crosshyou.info

です。