2017-01-31 2 views
0

私は自分のデータセットを予測するためにsklearn SGDClassifierを使用しています。 私はどのラベル/カテゴリにも分類すべきではないテキストを持っていますが、テストデータを「kjhd askdhajksdh asd askh」と指定すると、それは与えられたカテゴリの1つに分類されています。sklearn SGDClassifierは、一致するものがない場合にラベルを生成しますか?

私も確率で作業しましたが、まだこの迷惑テキストに対して貴重な確率を持っています。

私の質問は、このような場合に分類器が「一致しませんでした」などのようなものを返すことができるということですか?

答えて

1

いいえ分類器は、最も確率の高い学習のラベルのいずれかに入力を分類しますが、これらの確率は小さいです。

decision_functionを使用して、ラベルのしきい値を設定することができます。 次のようなもの:

threshold = 0.25 
if confidence_score < threshold: 
    print("No match found") 
関連する問題