私たちは、たくさんのツイートやブログをsolrに保存しています。さえずりのためのユーザーの検索のような言及場合Solr検索の問題
は今、@rohitは、単に単語のRohitを含むレコードも返されています。我々は完全一致「@rohit」を行う場合でも、私はこれが原因で、特別なcharatersに分割WordDelimiterFilterFactoryの使用が起こる理解し、
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.WordDelimiterFilterFactory
は、どのように私は、「@」なしに戻らないためにSolrのを強制することができます。私はsplitOnCaseChangeとstemEnglishPossessiveが役に立ちますので、WordDelimiterFilterFactoryを削除したくありませんか?私がはっきりしていることを願っている。
よろしく、
のRohit
、whitespacetokenizerfactory上WordDelimiterFilterFactoryを使用することの利点は何ですか? – sesmic
もう一方を使用しないでください。 WhitespaceTokenizerFactoryを使用するときは、検索に使用できる用語を作成するために実際にWordDelimiterFilterFactoryが必要です。 –