〜10.000点の座標リスト(latitute、longits)と〜100万点の同じ種類の座標リストBがあります。他の点から最も近い点を効率的に見つける
私は、リストBの各要素のリストAにおける最も近い点を見つけたい
私がすでにやっていることは二つのリストの直積を作成し、半正矢を使用してすべての組み合わせの距離を見つけることです式。
そしてIは、総組み合わせは100億以上であるので、距離を計算するのにかかる時間が長すぎるリストBに
の各点の最小距離を有する、リストAのポイントを得ます。
リストBのすべてのポイントがリストAのポイントと一致するようにする方法はありますか?
私は質問に詳細を追加することを検討します。予想される最小距離はどれくらいですか?覆われた面積はどれくらいですか?球のどの部分? 'A'サイズは固定されていますか?正確なソリューションが必要ですか?データに応じて動作するかどうかは、より小さなリストでkdtreeを構築し、それを使ってRDD上にマッピングすることです。 – zero323