2017-11-15 11 views
0

最近パブリックデータセットに対してDBSCANクラスタリングを使用することを選択しました。しかし、パラメータEpsとminptsは非常に敏感であるため、全体のデータセットに対して優れたパフォーマンスを持つ良好なパラメータ値を得ることは非常に困難です。 DBSCANのパラメータをチューニングするときに余計なことがあるようです。私は、EMアルゴリズムを使ってGMMモデルのパラメータを調整することができることを知っています。EMアルゴリズムをDBSCANに使用することが可能かどうか疑問です。私はそれについていくつかのアイデアや提案が必要です。誰もそれを前に試した?EMアルゴリズムを使用して、1つのデータセットでDBSCANのパラメータ(eps、minpts)を決定する方法はありますか?

+0

代わりにOPTICSとHDBSCAN *を試してください。私はEMがあなたをどこにでも連れてくるとは思わない。 –

+0

ありがとうございます。 HDBSCANを後で試してみます。 – ZHENGZhuang

答えて

0

GMMは確率モデルであるため、ガウス混合モデルによるEMアルゴリズムはうまくいきます。それは各点の確率をもたらし、確率を最大にするためにモデルパラメータを推論する方法を知っています。

DBSCANにフラグを立てても意味がありません。この連結モデルには「確率」はありません。接続されているのはバイナリプロパティなので、これを最大限にしようとすれば、すべてが接続されます。イプシロン=不一致。

+0

良い答え! 「接続性モデル」と「接続はバイナリプロパティ」を意味するものを簡単に説明してください。 – ZHENGZhuang

+0

DBSCANの資料を参照してください。 –

関連する問題