私はさまざまなテキストフィールドを持っていますが、値にハイフン/ダッシュが含まれることがあります。オメガ3。 「オメガ」や「オメガ」を検索すると関連性の高い結果が得られますが、「オメガ3」を検索するとゼロの結果が得られます。Solr: 'hypens'で検索/ダッシュが0の結果を返します。
'WordDelimiterFilterFactory'でcatenateAll = 1に設定するとこの問題は解決されますか?はいの場合、クエリ時間とインデックス時間の両方で1に設定する必要がありますか?あるいは、この問題を解決するために何か必要なことはありますか?ありがとう!
以下は、テキストフィールドタイプを定義するスキーマの部分です。
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt" />
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt" />
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
</fieldType>
関連するクエリURLと、それを処理しているクエリパーサーを含めてください。これは遠いですが、もしDismaxがそれを扱っているならば、 '-3'は "'3'が結果から禁止されていることを意味します:-)ファルケッチされたシナリオを除いて、ダッシュは構文を破っているかもしれません: URLレベル](http://www.w3schools.com/tags/ref_urlencode.asp)と[solrレベル](http://lucene.apache.org/java/2_9_1/queryparsersyntax.html#Escaping+Special+Characters) – aitchnyu