2016-07-21 14 views
1

私はsvm lightを使用してバイナリ分類のモデルを訓練しています。モデルを使用して、私はいくつかの例をテストしました。私は予測ファイルの出力を見るのに驚きました.1より大きい値と-1より小さい値を含んでいます。私は範囲が[-1,1]と思った。私は何か間違っているのですか?svm予測ファイルの値が1より大きい

+0

なぜあなたは範囲[-1; 1]を持っていますか? 2つのクラスで分類する場合は、{-1; 1}にする必要があります。いくつかの変形は、-1 [1]以内の確率を与える[新しいデータがガターにあるとき。他のものは、樋への距離を探し、その外に{-1; 1}とは異なる値を持っています。あなたが何を期待しているのか、なぜならもう少し説明してもらえますか? –

+0

@IgorOA、私の理解は予測が-1であり、+ 1がそれぞれ+と+の正の例であった。しかし、予測は確実性の尺度として-1と1との間の任意の値であり得る(-1/+ 1は100%確実であることを意味する)。しかし、これは間違っているようです。 – Rakib

答えて

1

SVMの仕組みを理解すれば、値が[-1、1]の間隔で囲まれないのは理にかなっています。 SVMは、線からの距離を最大にしながら、負のデータ点と正のデータ点を区切る線を描画しようとします。

予測ファイルの値は、正の値が超平面の正のクラス側にあり、負の値が超平面の負のクラス側にあるSVM最適超平面からのデータの距離を表します。これらの距離は、任意に大きくまたは小さくすることができ、これ画像で見ることができるように制限されていません。私は、彼らが自信になるように値を正規化し、そのようなPlatt's SMOWeka's implementationなど、いくつかのSVMの実装を見てきました

A data point could be infinitely far from the hyperplane in feature space.

[0,1]の間隔で囲まれた正のクラスの値ですが、超平面から遠いデータポイントは超平面の近くにあるよりも確実であるため、両方の方法でSVMがどのように分類されているのかを判断する上で問題ありません。

関連する問題