私はSVM分類にscikitlearn
を使用しています。Svm予測のデフォルト値Scikitlearn
指定されたテスト項目がトレーニングセット項目のいずれとも一致しない場合、つまり距離が非常に大きい場合にデフォルト値を返す分類器が必要です。それは可能ですか?
例については
のは、私のトレーニング・セットが
X= [[0.5,0.5,2],[4, 4,16],[16, 16,64]]
であると私はトレーニングに
clf = svm.SVC()
clf.fit(X, y)
を実行し
y=[0,1,2]
にラベルを付けましょうその後、私は予測
clf.predict([-100,-100,-200])
は、今、私たちは[-100,-100,-200]
が離れすぎてトレーニングのいずれかからであるテスト項目を見ることができるように、この場合には予測はこのアイテム[16, 16,64]
ある[2]
をもたらすだろう、そこにある実行とにかくそれが何かを返すようにする(トレーニングセットからではない)?
広すぎて非公式です。しかし、あなたはおそらくskirarnでも利用可能なアウトライアー検出/ワンクラスのSVMを求めます。 – sascha
はい、実際には、項目がトレーニングセット項目のいずれかに一致するかどうかを判断する必要があります。値については気にしません。たとえば、一致する場合は1、一致しない場合は-1 。 –