2016-12-05 8 views
1

私はLuceneでの索引付けと検索に標準のAnalyzerを使用しています。私は最近Shingles(2単語のshingles \ bigrams)に遭遇し、私の研究でこれまでに見つけた唯一の利点は、フレーズの検索がより速くなるということです。 マイナス面では、私のインデックスサイズが増加しました。 私は、私のアプリケーションが帯状疱疹を使用することによって利益を得る本当の利点は何ですか? Shingles/NGramTokenizerを使用して文書をトークン化してインデックスを作成すると、他の既存の検索(Stem \ Fuzzyなどの検索)にどのような影響がありますか?ShingleFilter n-GramTokenizerのメリット

誰かがこのトピックについていくつかの光を当ててください。

答えて

1

他の検索には影響しませんが、インデックスのサイズはStandard Analyzerを使用してインデックスされたものと比べて非常に大きくなります。

関連する問題