私は全文検索エンジンのアーキテクチャを設計しています。その1つは、応答時間の少ない大規模なデータセット間でのクエリの処理です。私が理解できる1つのことは、逆索引をパーティションに分割することです。これには、用語ベースのパーティションとドキュメントベースのパーティションという2つの戦略があります。しかし、大きなデータセットの中で倒立型検索を高速化する他の方法があるかどうかを本当に知りたいですか?逆索引検索を高速化する方法は?
4
A
答えて
8
このvideoは、分散フルテキスト検索エンジンのElasticSearchの開発者であるShay Banonとのスピーチです。ビデオでは、用語ベースのパーティションとドキュメントベースのパーティションの長所と短所について説明します。
基本的に、用語ベースのパーティションは、プロセス/ノード間でネットワーク帯域幅が大きすぎます。そして、うまく実装するのは難しいです。ドキュメントベースは、実装と結果の作成が非常に簡単です。
また、in this lecture by Jeffrey Dean彼はまた、違いを説明し、Googleがドキュメントベースのパーティションを使用していると言います。
これは、検索エンジンを配布する2つの主な方法です。私は他のやり方を知らない。とにかく、情報検索の文献を検索して、その対象に関する斬新な研究をしたいと思うかもしれません。
関連する問題
- 1. リストビューの検索を高速化する
- 2. MySQLテーブルで検索を高速化する方法(No Index)
- 3. 製品の検索クエリを高速化する方法
- 4. 検索手順を高速化
- 5. 検索は速く、検索は遅くSSMSの検索が高速です。
- 6. mongodbコレクションの高速検索方法
- 7. AudioInputStream - 高速検索
- 8. jQuery/Javascript検索機能の高速化
- 9. 検索とマクロの高速化
- 10. 検索クエリの高速化elasticsearch
- 11. pandas dataframe str.contains検索の高速化の方法
- 12. 高速検索と更新のためのSQL索引
- 13. Rの正規表現検索を高速化するには?
- 14. 高速ハッシュアルゴリズムの検索
- 15. DynamoDBの高速検索
- 16. Mysql対高速検索
- 17. JAXBオブジェクトの高速検索
- 18. 高速挿入検索
- 19. 高速な検索後、サブプロセス
- 20. JTableの高速検索アルゴリズム
- 21. SQLサーバー2008高速検索
- 22. Python - 高速ファイル検索
- 23. 繰り返し文字列検索を高速化する方法
- 24. Mongooseは複数のフィールドで検索を高速化します
- 25. flパラメータはsolrで検索を高速化しますか?
- 26. Excelファイルの文字列を高速検索する方法
- 27. 後置ワイルドカード検索を高速化する
- 28. "contains"検索を高速化するMySqlのフルテキストインデックス処理
- 29. 検索を高速化するためのチェックサムが良い
- 30. 1500万レコードで高速検索する方法