私は、次のデータをSolrのために送信されました:htmlタグのないクエリsolr?
{
"id":"kkk",
"name":"<div>book</div>"
}
Solrには、データを受信した後、私は「DIV」を検索すると、結果は表示されませんが、私は「本」を検索すると、結果が表示されます、 どのようにできるのか ?ここで は私のスキーマです:私はインデックスを行う際
<field name="name" type="text_html" indexed="true" stored="true"/>
<fieldType name="text_html" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<charFilter class="solr.HTMLStripCharFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="lang/stopwords_en.txt"
/>
</analyzer>
</fieldType>
SolrにはHTMLタグを取り除くことができ、私が直接データSolrに送信する場合は、どのように私は、HTMLタグを取り除くことができますか?
データを直接送信するとどういう意味ですか? –
solrはファイルをインデックス化するのではなく、データを格納するだけです。 –
Solrはインデックスフィールドを分析します。 –