2011-10-18 10 views
0

私はLucene.NETを使用しています。たとえば、次のようなテキストのインデックスを作成しようとしています。「カテゴリTこの記事は、以前は次のIDで公開されていました:Lucene.NETは1文字の単語をインデックスに登録していますか?

太字で書かれていますが、すべてのものがかなりインデックスされていますが、Tは無視されます。

誰かがこの問題を知っていますか?私は次の構文を使用しています。

doc.Add(new Field("text", text, Field.Store.NO, Field.Index.TOKENIZED)); 
+0

もっとコードを表示する。 –

答えて

0

"T"は標準アナライザーではデフォルトで停止語です。アナライザーを作成するときは、独自のストップワードリストを用意することができます。

ただ、このようなアナライザの作成:

StandardAnalyzer standardAnalyzer = new StandardAnalyzer(new string[]{"an", "a", /*other stopwords*/}); 

をそして物価スライドし、検索時にそれを使用しています。

+0

私はStandardAnalyzerを使い、Lukeツールを使ってTがインデックスに含まれているかどうかを調べます。私は "categorie T"の正確な単語の組み合わせ検索を行い、何も見つかりません。 – wsplinter

+0

@wsplinter上記の解決策を確認してください。 – Dmitriy

+0

「T」はストップワードではありません。 –

関連する問題