2012-04-17 20 views
1

私はOpenSearchServer(コミュニティ版)v1.2.4-rc3 - stable - rev 1474 - build 802を使用しています。C#およびC++プログラミングWebサイトをクロールします。今私はC#またはC++を検索するとき、ソフトウェアは#、+のような特殊文字を取り除きます。その結果は、ソフトウェアが返す結果ではありません。 OpenSearchServer/Luceneで(#)のような特殊文字をどうやって扱うのですか?誰か私にアイデアを提案できますか?事前に感謝しますOpenSearchServer/Luceneで(#)のような特殊文字を処理するにはどうすればよいですか?

答えて

1

C#とC++コードの用語を表すのに必要な特殊文字を保存するカスタムまたはセミカスタムのトークナイザを使用するようにインデックス作成戦略を変更する必要があります。このトークナイザは、索引作成中と検索中の両方で使用します。

オフの手、私は(トークナイザを使用して(トークナイザを構築する方法として、いくつかのアイデアを得るためにorg.apache.lucene.analysis.standardorg.apache.lucene.wikipedia.analysisになりますJFlexなどの字句アナライザ)ジェネレータは、トークナイザをハンドコーディングするよりもむしろ呼び出すことができます)。

関連する問題