私は、次の要件を満たす機械学習アルゴリズムが必要になります。機械学習 - 1つのクラス分類/新規性検出/異常評価?
- トレーニングデータは、すべての(私は負のデータサンプルを生成することができないと)同じ、「正」のクラスに属する、特徴ベクトルのセットです。
- テストデータは、正のクラスに属するかどうかに関係なく、いくつかの特徴ベクトルです。
- 予測値は正のサンプルからの距離を示すはずの連続値でなければなりません(0はテストサンプルが陽性クラスに明確に属していることを意味し、1は明白に負であることを意味しますが0.3はやや正の値を意味します) )
例: ここで、特徴ベクトルは2次元の特徴ベクトルです。
ポジティブトレーニングデータ:
- (0,1)、(0,2)、(0,3)
試験データ:
- (0、10 )は異常ではなく、別のものでなければなりません。
- (1,0)は異常である必要がありますが、(0,10)より高い「ランク」を持つ必要があります。
- (1,10)は異常である必要があります。さらに高い異常 "ランク"があります。
アイデアは(異常検出におけるような)正例からの「距離」を検討することです。 私は実際に、異常検出アルゴリズムをパーセンテージで探しています(異常の規模は何ですか)。 – ido4848
あなたのデータは何ですか?いくつかのサンプル入力データと結果として期待しているものを提供できますか? – miraculixx
@miraculixx例を追加しました – ido4848