2017-10-13 16 views
0

solrで会社を検索すると、com pany、comp-any、companyなどの類似の結果が結果に含まれます。solrを使用して取得する方法。solrの近接検索の改善方法

+0

あなたはすでに何をしようとしたのですか? – Mysterion

+0

「類似の結果」とみなされるルールの正確な内容は何ですか? – MatsLindh

+0

私がウォルマートを検索すると、ウォルマート、ウォルマート、ウォルマートとその逆が表示されます。これを達成する方法 – Savitha

答えて

0

指定したユースケースについては、nグラムを使用できます。 「パン」、「COM」、「OMP」、「MPA」、:

<analyzer> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
    <filter class="solr.NGramFilterFactory" minGramSize="3" maxGramSize="7"/> 
</analyzer> 

このフィルタは、指定したサイズの部分でトークンを破るなど、単語「会社」のために、次のトークンを生成します「comp」「ompa」「mpany」「pany」「company」「omany」「compan」「ompany」「ompany」「company」

TAKE CAREこのフィルタはパフォーマンスを低下させ、索引を指数関数的に増加させ、使用しているフィールドのサイズに応じてSolrを実行します(コンテンツ抽出に使用する場合など)。だから、それを使用するために賢明なフィールドを選択:)

ここではそれについての例でいくつかの有用な情報です: https://lucene.apache.org/solr/guide/6_6/filter-descriptions.html#FilterDescriptions-N-GramFilter

関連する問題