を使用して2Dデータをセグメント化すると、いくつかの助けが必要なセグメント化の問題があります。
2次元空間の大きな点集合を分割しようとしていますが、これには1つのカテゴリ変数もあります。プライマリセグメンテーションは、空間データのクラスタリングによって行う必要があり、必要に応じて、クラスタをカテゴリ変数に基づいてさらに分割する必要があります。さらにカテゴリ変数
例は次のとおりです。
都市内の住宅の地理座標のデータセットがあるとします。各家の場所に加えて、我々はまたどの色を持っているか知っています。家の位置と色をプロットすると、下の画像が得られます。この町には3つの町があり、そのうち2つは地理的に分かりにくいですが、外見に基づいてはっきりと区別できます。
上記の例では、アカウントにカテゴリ変数を取らないであろうDBSCANまたはK-means法等のクラスタリングアルゴリズムを有するセグメントに困難であろう。さらに、紫とオレンジの住宅を分けることはできません。なぜなら、両方が同じ地域にあるからです。それは、奇妙な色の家屋が地理的な境界の外のクラスターに割り当てられることにつながるかもしれないので、gowerの距離を持った多次元スペースでクラスター化することも難しいでしょう。
この問題を解決するにはどうすればよいでしょうか?この種の問題に対処できるクラスタリングアルゴリズムのPython(またはR)実装がありますか?あるいは、コンピュータビジョンのアプローチがもっと合うでしょうか?
すべての入力を歓迎します。
平均シフトセグメンテーションを見ましたか? – Shai
私はちょうどそれを見て、それは興味深いようです。それは混合されたカテゴリの値のクラスターで動作しますか?また、これはおそらく、カテゴリ値を連続変数にマップする必要があることを意味することを訂正していますか? –
あなたはあなたのカテゴリーデータへのマッピングを適用する必要があります。 AFAIK meanshiftを使用すると、空間ドメインとは異なる方法で「カテゴリ」のディメンションを扱うことができます。したがって、3つのカテゴリがある場合は、バイナリ3ベクトル(5Dデータで終わる)にマップできます。 – Shai