2017-03-07 17 views
1

インターネット上では、教師と教師なしのマシンラーニングアルゴリズムのアプリケーションを見ることができますが、マシン学習アプリケーションの品質を維持することについては話していません。 教師なし機械学習アルゴリズムをテストする方法についての最近の分析では、これらの点を育てた:

教師なしマシンラーニングアルゴリズムのテスト

1)クロス検証テスト:データセットが等しい折り目(部品)に分割され、1を除くすべての折り目がトレーニングデータセットとして使用されています後でテストデータセットとして使用されます

テストとトレーニングのデータセットの使用に関するその他のオプションはほとんどありません。
出力が不確実な教師なしMLアルゴリズムをより効果的にテストする方法はありますか?

+0

教師なしマシン学習アルゴリズムの品質を評価することは、外部基準(教師なし)が存在しないため問題があります。特定のアプリケーションをターゲットにしていない場合(クラスタリング、次元削減など)、この質問は広すぎて答えられません。さらに、相互認証は、教師付き機械学習アルゴリズムの評価に最も使用される。 –

+0

https://stats.stackexchange.com/でこの質問をすることをお勧めします。 –

答えて

0

使用したアルゴリズム(および選択された距離)のタイプによっては、グループ内の差異とグループ内の差異が大きく変化しているかどうかを調べることができます。

あなたのアルゴリズムは、あなたがそれを構築したときと同じくらい良い状態であれば、分散とその分散はあまり変わってはいけません。シュリンク(またはその逆)の差がある場合、アルゴリズムによってグループが以前と同じように分離されていないことを意味します。

もう一度やってみると、アルゴリズムを再学習しても、同じグループに属しているかどうかを確認するために、いくつかの観察結果を保持することです。そうでない場合、アルゴリズムが間違っていることを意味するわけではありませんが、この場合警告を送信してより深く見ることができます。

関連する問題