私は約500万語のテキストを保持する約100万行のテーブルを持っており、これらのテキスト内で単語を検索しています。テキストを繰り返して検索することは時間的に効率的ではありません。何か案が?テキスト検索アルゴリズム
答えて
私はこの希少な情報ではLuceneの
を示唆している、私はあなたがinverted indexesを見てお勧めします。私が言うことができる限り、簡単に構築し、あなたのケースのための高速検索。既にサポートしているデータベースに切り替えることができない場合に備えて、あらゆる種類のデータベース環境で実装するのも非常に簡単です。
さらに詳しい情報をお伝えいただければ、別の解決策が役立つかもしれません。
しかし、私はlevenshteinメソッド(edit_distance)を使って、2つの単語(ユーザが入力した単語とデータベーステキストの次の単語)がどれほど類似しているか調べています。同じ方法でどのように逆インデックスとレベンシュテインを使うことができますか?私はそれについて考えています。なぜなら、「猫」がテキストに見つからなければ、私は「帽子」を探しているかもしれませんし、「帽子」やユーザーが入力したquuteを含むテキストがあります。かなり "。 – Coenni
反転インデックスとレベンステインの両方を使用する場合は、トライ内で逆インデックスを実装できます。正確に行うと、Levenstheinルックアップをサポートしようとします。各リーフには、一致したすべてのドキュメントのリストが含まれます。次に他の人が良い答えを見つけることを可能にするために、質問の中でより詳細な情報を与えてください。 – LiKao
- 1. 検索アルゴリズム
- 2. SQLAlchemy検索アルゴリズム
- 3. 検索アルゴリズムは
- 4. .net検索アルゴリズム?
- 5. フットプリント検索アルゴリズム
- 6. 検索アルゴリズム
- 7. バイナリ検索ツリー?アルゴリズム
- 8. 検索ロジックとアルゴリズム
- 9. XQueryマルチフィルター検索アルゴリズム
- 10. KMPパターン検索アルゴリズム
- 11. 単語検索アルゴリズム
- 12. Googleパンダ検索アルゴリズム
- 13. 外部検索アルゴリズム
- 14. ウェブサイトの検索アルゴリズム
- 15. 最適点検索アルゴリズムの検索
- 16. グラフ/分子比較アルゴリズムのテキスト検索を適応させる
- 17. 文字列検索アルゴリズム
- 18. クイック検索アルゴリズムのコストモデル
- 19. アルゴリズムの並列検索
- 20. 一律コスト検索アルゴリズム
- 21. A *検索アルゴリズム無限ループ
- 22. 検索文字列アルゴリズム
- 23. JTableの高速検索アルゴリズム
- 24. 検索ツリーとビルドツリーのアルゴリズム
- 25. マージ検索結果アルゴリズム
- 26. A *検索アルゴリズムの実装
- 27. ファジー文の検索アルゴリズム
- 28. A *検索アルゴリズムの使用
- 29. Googleのオンサイト検索アルゴリズム
- 30. パス探索アルゴリズム:A * Vsジャンプポイント検索
テーブルデータの保存にはどのような方法を使用していますか?フラットファイル? MySQL?あなたの質問にはかなり重要な情報です – Seph
mssql varchar(max)in tableしかし、私はストレージメソッドを変更することができます。 C#、mssql私は使用しています。 – Coenni