2017-02-27 7 views
-1

私は、私のデータセット内の異常値を取り除くのに役立つ簡単な異常値検出手法を探しています。 私は3000の正弦波サイクルから得られた部分放電測定値である200万のサンプルを持っています。つまり、計測機器は、サイクル内の小さな変化でも必要なデータを測定することができます。 私のデータは、時間の経過と共に正弦波を断熱材に塗布し、それらを記録して200万のサンプルを得ることからの測定値です。 重要なデータは他のデータからの距離が大きいため、データセットから削除されるため、kNN検索のような従来の方法とアルゴリズムを使用して、アウトライアを検出することはできません。 私は検索して、文脈データセットの外れ値検出のためのさまざまな方法があることを発見しました。手伝ってくれませんか?コンテキストデータの単純な外れ値検出アルゴリズムとは何ですか?

答えて

0

1オプションでフィーチャエンジニアリングを実行し、コンテキストデータを数値データに変換することができます(例:「1ホットエンコーディング」、「平均で5日ごとの発生」の機能を持つトレーニングなど)。毎日の予測。

関連する問題