私は多数のユーザ(数十万人)からの位置データを持っています。私は現在の位置といくつかの履歴データポイント(1時間後の分データ)を保存します。人の群衆のためのクラスタ分析
誕生日パーティーなどの自然なイベントの周りに集まっている人を検出するにはどうすればいいですか?小規模の人でも(5人から始めると言わせてください)、検出されるはずです。 このアルゴリズムは、ほとんどの場合リアルタイムで(または少なくとも1分に1回)動作して、群衆が発生したときにそれを検出する必要があります。
私は多くのクラスタ分析アルゴリズムを検討しましたが、そのほとんどは悪い選択肢のようです。彼らはあまりにも長い(私はO(n^3)とO(2^n)を見た)か、あらかじめいくつのクラスターがあるかを知る必要があります。
誰かが私を助けることができますか?ありがとうございました!
ありがとうございました!ここで問題となるのは、1人のユーザーがそれらの間を移動すると、近くにある2つのクラスターが接続される可能性があるということです。これは、人口密度の高い地域では非常に簡単に起こります。 (単一リンケージ問題) – Grunzwanzling
これはどのように問題になりますか?あなたは1つのクラスタを取得します。このように(人がお互いに住んでいる時に)誰もが連鎖しないように見守らなければなりません。あなたは座標を持っているので、あなたはそのようなケースを検出することができるはずです。 GPSは明らかにおよその位置を示します。 –
どうすればいいですか?すでにイベントにリンクしているユーザーに、相対的に遠く離れた「リンク範囲」が少ないことがありますか?そして、時間的側面:毎分アルゴリズムを実行するかもしれませんが、実際にこの場所で10分で少なくとも7回イベントが検出された場合に限り、実際に起動します。このようにして、私は時間と空間のアスペクトを理解しました。私はそれがいつもおおよそ同じ人であるかどうかを確認する必要があります – Grunzwanzling