すぐに文字列をJavaのコレクションと比較します

文字列の編集距離をコレクションに対して計算して、最も近いものを見つけることを試みています。私の現在の問題はコレクションが非常に大きく（約25000アイテム）、セットを同じ長さの文字列に絞り込む必要がありましたが、それでもそれは数千文字列にしか絞られず、依然として非常に遅いです。類似した文字列をすばやく検索できるデータ構造があるのでしょうか、この問題に対処する別の方法がありますか？すぐに文字列をJavaのコレクションと比較します

出典

2012-02-04 Lezan

どうやってやっていますか？いくつかのコードを表示できますか？ –

「類似」を定義します。 –

同様に、「exanple」や「example」や「weird」や「wierd」などの一般的なスペルミスである単語を比較することを意味します。 – Lezan

BK-treeのようなサウンドがあなたが望むかもしれません。それらについて議論している記事があります：http://blog.notdot.net/2007/4/Damn-Cool-Algorithms-Part-1-BK-Trees quick Googleでは、いくつかのJava実装が生成されます。

出典

2012-02-04 08:50:22 SimonC

ありがとう私はこれを見て、あなたにそれがどうなるかを教えてくれます、ありがとう！ – Lezan

それはそれをした、検索の別の実装が必要でしたが、それは完璧でした！ありがとうございました！！ – Lezan