2017-05-23 4 views
1

私は、ノベルティ検出のためにMicrosoft MLパッケージを使用して1クラスSVMモデルを構築しようとしており、いくつかの結果を得ることができました。テストデータを使用した予測結果には、「スコア」という列が含まれていますが、ここでの意味についてはあまりよく分かりません。私がオンラインで検索すると、それについての非常に良い説明はありません。Microsoft rxOneClassSVMの予測のスコアはどういう意味ですか?

機械学習の初心者として、スコアが高ければ高いほど、データ入力が異常である可能性が高いため、スコアが何らかの真の異常である確率を表していると思います。私が間違っている場合は私を修正してください、私はまた、しきい値を決定するアルゴリズムについて疑問に思っています。私はGAのようないくつかは知っていますが、使用する適切なものを選択する方法については本当に混乱しています。

ありがとうございます!

答えて

1

あなたは「スコアが高いほど、異常である可能性が高い」と言います。しきい値を見つけるために、私はrxLinePlotを使って次のようなグラフをプロットします:plotting scores in oneclasssvm

上記のグラフから、しきい値は0.1より大きい任意の値であることが明らかです。そのようなプロットは、ユースケースに基づいてしきい値を計算するのに役立ちます。あなたのマシンでこのグラフを生成したい場合は、ここに完全なRコードがあります:https://gist.github.com/ramnov/b08224b06c75d613688f0c8d61511d9b

+0

グラフをプロットせずにしきい値を決定する方法はありますか? – ELI

+0

閾値は主観的です。データに依存しますので、閾値を決定する標準的な方法はないと思います。グラフをプロットすることは私が知っている一つの方法です。 –

関連する問題