2012-04-14 5 views
0

私は長さを持つStandardAnalyzerをラップするカスタムアナライザーを作成しました。今私は、数字だけを含むすべての用語を除外したいと思います。 これを実装する最良の方法は何ですか?LuceneのTokenStreamから数字を削除するには?

+0

ただ1つのフィールドにありますか?その場合は、FieldBridgeを使用して、数値だけを含む用語をドキュメントに追加しないでください。 – robertvoliva

+0

LuceneのFieldBridgeとは何ですか? –

答えて

1

カスタムの場合はTokenFilterの場合があります。最も簡単なフィルタのうち1つ、LowerCaseFilterをチェックしてください。私はあなたがそれらの行に沿って自分自身を書くことは簡単だと思うでしょう。

0

正規表現を使用すると、PatternReplaceFilterを使用してTokenStreamから数値を検出して削除することができます。

関連する問題