インデックス時間とクエリ時間でSolrのEdgeNGramFilterFactoryを使用する違いは何ですか？

私は多くの違いに気付きませんでしたが、インデックス時にEdgeNGramFilterFactoryを使用すると、ドキュメント用語自体が部分文字列に分割され、検索文字列がこれらの部分文字列と一致し、同様にインデックス時に入力するクエリ部分文字列に分割され、通常の文書文字列にマッチしますか？インデックス時間とクエリ時間でSolrのEdgeNGramFilterFactoryを使用する違いは何ですか？

これは、このプロセスを表示する適切な方法ですか、私は誤解をしていますか？

ありがとうございます！ Solrのウィキ1として

出典

2017-07-20 Sam

： -

https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.EdgeNGramFilterFactory

エッジn-グラム分析は、インデックスまたはクエリ時間（または両方）のいずれかで行うことができるが、この例に示すように、典型的には、より有用です同じ位置に索引付けされたすべてのnグラムで索引時にnグラムを生成することができます。照会時には、照会用語はnグラム分析なしで直接照合することができます。

したがって、インデックス時にnグラム分析を実行すると、基本的に生成されるnグラムが互いに近くなり、パフォーマンスが向上します。

私はこれを配列とリンクリストと見なします。配列では、要素は互いにより近くなり、より高速なトラバーサルにつながります。

出典

2017-07-21 04:11:35 Max08

インデックス時間とクエリ時間でSolrのEdgeNGramFilterFactoryを使用する違いは何ですか？

答えて

関連する問題