カスタムアナライザ実装のcreateComponents実装でHTMLStripCharFilterを使用しましたが、HTMLはコンテンツからは削除されません。コードを以下で見つけてください。HTMLStripCharFilterがカスタムアナライザのcreateComponent実装で動作しません
@Override
protected TokenStreamComponents createComponents(String fieldName)
{
StandardTokenizer source = new StandardTokenizer();
source.setReader(mStripHTML ? new HTMLStripCharFilter(getReader()) : getReader());
source.setMaxTokenLength(maxTokenLength);
TokenStream result = new StandardFilter(source);
result = new LowerCaseFilter(result);
return new TokenStreamComponents(source, result);
}
ありがとうございました。しかし、私は昨日luceneのドキュメントで解決策を得ました。 –