Lucene.NETは1文字の単語をインデックスに登録していますか？

私はLucene.NETを使用しています。たとえば、次のようなテキストのインデックスを作成しようとしています。「カテゴリTこの記事は、以前は次のIDで公開されていました：Lucene.NETは1文字の単語をインデックスに登録していますか？

太字で書かれていますが、すべてのものがかなりインデックスされていますが、Tは無視されます。

誰かがこの問題を知っていますか？私は次の構文を使用しています。

doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED));

2011-10-18 wsplinter

もっとコードを表示する。 –

"T"は標準アナライザーではデフォルトで停止語です。アナライザーを作成するときは、独自のストップワードリストを用意することができます。

ただ、このようなアナライザの作成：

StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/});

をそして物価スライドし、検索時にそれを使用しています。

2011-10-18 09:17:56 Dmitriy

私はStandardAnalyzerを使い、Lukeツールを使ってTがインデックスに含まれているかどうかを調べます。私は "categorie T"の正確な単語の組み合わせ検索を行い、何も見つかりません。 – wsplinter

@wsplinter上記の解決策を確認してください。 – Dmitriy

「T」はストップワードではありません。 –

答えて