DBSCANアルゴリズムでは、外れ値はノイズとして破棄されることがありますが、アプリケーションによっては、これらのノイズの多いデータが、より定期的に発生するものよりも面白くなる可能性があります。どうして ?DBSCANアルゴリズム外れ値
0
A
答えて
1
異常値としてマークされたポイントは、それ自体破棄されません。クラスタ内にないポイントです。それでもクラスター化されていない点の集合を調べ、それらを解釈しようとすることができます。
DBSCANは、いくつのクラスタが存在するか、どのような形状であるかを知らなくてもクラスタを提供するように設計されています。それは、十分に密な領域の開始点からクラスタを反復的に拡張することによってこれを行います。外れ値は、sparsleyの人口領域にある点(epsおよびminPointsパラメータで定義されているとおり)です。
実際には、これらの異常値を含まないパラメータを選択するには注意が必要です。それらがクラスタに含まれている場合、それらはしばしばクラスタ間の橋渡しとして作用し、それらを分析的に役に立たないブロブに併合させる。
1
クラスタポイントは、と同様にです。彼らは同じ性質を持ち、同じ物語を伝え、重複するかもしれません。
ノイズポイント(DBSCANは実際の異常値を検出できません!)は、すべてクラスタ化されないデータポイントです。 はクラスタ化されていないため、2つ目のデータポイントがの通常のデータであると考えることさえあります。
実際の異常値(エラーまたは特に興味深いオブジェクト)を検出するには、特殊な異常検出アルゴリズムを使用します。
関連する問題
- 1. DBSCANアルゴリズムへの入力値を決定する
- 2. ELKI DBSCANイプシロン値の問題
- 3. scikit-learnのDBSCANアルゴリズムの入力行列とパラメータ
- 4. sklearnの複数のeps値DBSCAN
- 5. ELKI dbscanの例
- 6. dbscanのcluster_selection_methodエラー
- 7. DBSCANアルゴリズムを使用してPythonのポイントリストを表示する方法
- 8. 外部検索アルゴリズム
- 9. DBSCANプロット - plt.plot()で渡されたカラー値がValueErrorを投げています
- 10. DBSCANのクラスターラベルの変更
- 11. DBSCANクラスタリングの遠隔ポイント
- 12. PythonのDBSCAN - メモリ不足
- 13. scikit-learn DBSCANメモリの使用
- 14. PythonのコサインメトリックでのDBSCANエラー
- 15. DBSCANラベルのインポート方法 - Python
- 16. 自動クラスタリングのDBSCANとOPTICS
- 17. DBSCANを非数値データに使用できますか?
- 18. 期待値アルゴリズム
- 19. コンテキストデータの単純な外れ値検出アルゴリズムとは何ですか?
- 20. 数値アルゴリズムの範囲を外します
- 21. クラスタリングにDBSCANアルゴリズムを使用するデータセットでminpts = 4が最適な設定ですか?
- 22. DBSCAN評価の必要性は
- 23. ELKI DBSCANカラムを無視する
- 24. 分散システムでのDBSCANの実装
- 25. 外れ値をR
- 26. deflateアルゴリズムの長さの値
- 27. 数値の圧縮アルゴリズム
- 28. 数値変換のアルゴリズム?
- 29. Kadaneアルゴリズム負の数値
- 30. 理解「中央値の中央値」アルゴリズム