私は一連の行データを持っています(2-3の接続点)。 行をその類似点に分類するために使用できる最適な機械学習アルゴリズムは何ですか? (下の画像)行(移動経路)クラスタリング機械学習アルゴリズム
好ましくは、SciKit-LearnなどのPythonライブラリ。
編集: 私はDBSCANを試してみましたが、2行がある場合、私が直面した問題でした互いに交差し、時にはDBSCAN彼らは別の方向に完全にされているにもかかわらず、一つのグループにそれらを考慮。ここで
は、私がこれまでに見つかったソリューションです:
GeoPathクラスタリングアルゴリズム
ここでの考え方はグループに互いに非常に類似した旅行地理パスをクラスタ化することです。
ステップ:ステップ1からの各クラスタ内の傾き
-2-に基づい
1-クラスタ線、線のcentriodを見つけ、小さなグループ
にK平均 アルゴリズムクラスタにそれらを使用することにより3-ステップ2の各グループ内で、定義された長さのしきい値内で各行とグループ行の長さを計算します。
結果は類似した勾配を持つ小さなグループのグループになります。同様の移動距離である。
視覚化のスクリーンショットは次のとおりです。 黄色の線はすべて線であり、赤色は一緒に移動するパスのクラスタです。
これは実際にはクラスタリングと呼ばれます。しかし、このような単純なデータの場合は、単純なヒューリスティックを書き留めることができます。 – lejlot