2017-07-20 14 views
0

私は多くの違いに気付きませんでしたが、インデックス時にEdgeNGramFilterFactoryを使用すると、ドキュメント用語自体が部分文字列に分割され、検索文字列がこれらの部分文字列と一致し、同様にインデックス時に入力するクエリ部分文字列に分割され、通常の文書文字列にマッチしますか?インデックス時間とクエリ時間でSolrのEdgeNGramFilterFactoryを使用する違いは何ですか?

これは、このプロセスを表示する適切な方法ですか、私は誤解をしていますか?

ありがとうございます! Solrのウィキ1として

答えて

0

: -

https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.EdgeNGramFilterFactory

エッジn-グラム分析は、インデックスまたはクエリ時間(または両方)のいずれかで行うことができるが、この例に示すように、典型的には、より有用です同じ位置に索引付けされたすべてのnグラムで索引時にnグラムを生成することができます。照会時には、照会用語はnグラム分析なしで直接照合することができます。

したがって、インデックス時にnグラム分析を実行すると、基本的に生成されるnグラムが互いに近くなり、パフォーマンスが向上します。

私はこれを配列とリンクリストと見なします。配列では、要素は互いにより近くなり、より高速なトラバーサルにつながります。

関連する問題