あなたはそのトークナイザとしてsolr.KeywordTokenizerFactoryを使用するには、このフィールドを設定する必要がありますように思えます。
名前が実際には伝わらないので、このトークナイザは、基礎となるフィールドを1つのトークンとして扱い、空白、文字から数字、数字から文字へのトランジション、句読点、これらのためのcharフィルタを持っている)。
私はSolrの設定のための最新の仕様に関する最新ではありませんが、私はそのような何かに見える可能性があるというフィールドのスキーマ内のエントリを推測している:
<fieldtype name="myProductNumberFIeld" class="solr.TextField">
<analyzer>
<!-- can have a few filters of course -->
<charFilter class="solr.MappingCharFilterFactory"
mapping="mapping-ISOLatin1Accent.txt"/>
<filter class="solr.LowerCaseFilterFactory"/>
<!-- etc. -->
<!-- That's the main thing you need -->
<tokenizer class="solr.KeywordTokenizerFactory"/>
</analyzer>
</fieldtype>
をより一般的にしたいだろうしユーザーがこれらの識別子の特定の形式(句読点やその他の区切り記号がある場合はその区切り記号など)を常に認識しているわけではないため、これらのフィールドのリコールを改善する方法として、製品番号、部品番号、UPCなどの、等でなければならない)。
しかし、別のアナライザを使用すると、一般的なテキスト検索との関連付けができなくなるという問題があります。これは、些細なことでユーザーのクエリを処理する方法が1つしかないからです。
出典
2010-12-13 17:01:37
mjv