2011-02-05 47 views
7

GPSデータセットの解析には2つの質問があります。軌道(x、y)の軌跡を比較/クラスタリングし、データをマイニングする

1)軌跡の抽出私は、(latitude, longitude, date-time)という形の記録されたGPS座標の巨大なデータベースを持っています。連続したレコードの日時の値によると、私はその人に続くすべての軌跡/パスを抽出しようとしています。例えば;時間Mから、(x,y)のペアは、時刻Nまで連続的に変化しています。 Nの後に、(x,y)のペアの変化が減少し、その時点で、MからNまでの経路を軌道と呼ぶことができると結論づけます。軌跡を抽出する際にそれはまともなアプローチですか?推奨できるアプローチ/方法/アルゴリズムはありますか?これらのポイントを効率的に維持するよう私に提案したいデータ構造やフォーマットはありますか?おそらく、各軌道について、速度と加速度を計算することは有益でしょうか?

2)軌跡をマイニングする軌道をたどっていく/パスをとったら、どうすればそれらを比較/クラスタリングできますか?開始点または終了点が似ているかどうかを知りたい場合は、どのように中間のパスを比較するのですか?

どのように2つのパス/ルートを比較し、それらが似ているかどうかを判断します。さらに、どのように私は同様のパスをクラスタ化するのですか?

この問題について私が研究などに指摘できれば、非常に感謝します。

開発はPythonで行われますが、あらゆる種類のライブラリの提案は大歓迎です。

ありがとうございます。

+2

あなたのタグ。それらのどれも非常に人気がありません。私は 'gps'を' gis'に変更し、 'python'タグを追加することを検討したいと思います。 –

+0

http://gis.stackexchange.com/で質問をクロスポストすることを検討することがあります – radek

+1

そのデータベースにGPSデバイスIDがありますか? – yura

答えて

9

チューリッヒ大学のGeography Departmentで行われた作業を、特にPatrick LaubeSomayeh Dodgeで見てください。

は紙

個々の運動と地理的データマイニングを見てください。パーソナル・ナビゲーションルート

linkpresentation)でのハイライトのホットスポットのためのクラスタリングアルゴリズム 。これは、GPSデータに対するDBSCANカーネル密度推定法の使用を示しています。

また、NokiaのMobile Data Challenge 2012 Workshopからの論文は、特に、ここで役に立つことができます:

MobReduce:モビリティの状態複雑さを低減することが(link)をトレースし

ファビアン・ハルトマン、クリストフ・P.メイヤー、Ingmar Baumgartによっておよび

弾道クラスタリングの軌跡クリーニングフレームワークlink

Agzam Idrissov、Mario A.アルバータ大学Nascimento

+0

これらの人々は正確にこの分野で博士の質の高い仕事をしています "宇宙で異なる種類の動く物体の軌道間の類似性を明らかにする方法論の開発に焦点を当てています。 –

1

1)軌道を抽出する あなたは正しい方向にいると思います。おそらくgpsデータにはノイズがあり、ランダムウォーキングがあるかもしれませんが、それを克服するにはスプラインのようなスムーズな作業が必要です。軌道 マイニング


2)は、同様の軌道内の任意のビジネスセンスがありますか? (これは距離メトリックを構築するのに役立ちますし、mahootクラスタリングアルゴリズムのいくつかを使用することができます) 1.私はいくつかの人が停止した場所がより面白いので、場所の人気の統計を生成できると思います。 2.同じスタートエンドに異なるパスを見つけるためにルート類似性が必要な場合は、最初のスタートエンドロケーションをクラスタ化してから、曲線をシンプルにする必要があります(最大距離、整数距離 - 既知の機能メトリックのいくつか)