2009-07-18 12 views

答えて

1

WhiteSpaceAnalyzerはドットを保存します。 StopFilterはストップワードのリストを削除します。必要な分析を正確に定義し、分析計とトークンフィルタを組み合わせて達成するか、write your own analyzerを設定する必要があります。

0

StandardTokenizerは、文字間に発生するドットを保存します。 StandardTokenizerを使用するStandardAnalyzerを使用できます。または、StandardTokenizerで独自のアナライザーを作成することもできます。

訂正:頭字語からドットを削除するStandardFilterを使用するため、StandardAnalyzerは役に立ちません。 StandardTokenizerと追加フィルタ(小文字フィルタなど)からStandardFilterを差し引いた独自のアナライザを構築できます。

+0

urのコメントありがとうございました...参考、私は既に私のコードでStandardAnalyzerを使用しています: protected readonly StandardAnalyzer _analyzer = new StandardAnalyzer(stop_words); 頭字語からドットを削除しています... – Jimmy

関連する問題