2017-09-10 15 views
3

文字列があり、最も近いペアを探したい。お互いに近い2つの文字列を見つける方法

このペアを見つけるのに最も速い実用アルゴリズムは何ですか?

+0

あなたのデータセットは100k文字列です。新しいクエリが到着するか、またはデータセットの文字列を1つのクエリとして使用しますか? – gsamaras

+0

@gsamaras与えられた100kストリングの入力に対して、私は他のものよりお互いに近いペアであるただ1つの答えを求めます。 – eleanora

答えて

1

The Closest Pair Problem under the Hamming Metric」のMin、Kao、Zhuは、あなたが探しているものと思われ、最も近い単一のペアを見つけることに適用されます。あなたの場合、Dは、データ(1000)の次元とnデータセットの大きさD < N 0.294 <は、アルゴリズムはOで実行されるn(nは1.843 D について

0.533)。

+0

抽象的なものを見てみると、実用的なアルゴリズムに与える複雑さはO(n^2 D/log^2 D)であるようです。他のアルゴリズムは私にとっては完全に実用的ではないように見えます。 – eleanora

+0

はい、@eleanoraは、私の更新された答えを参照してください! – gsamaras

+0

O(n^1.843 D^0.533)の複雑さアルゴリズムは、この論文から完全に実用的ではありません。 – eleanora

関連する問題