2010-12-15 12 views
0

lucene.netを使用してasp.netで検索エンジンを開発しようとしています。私は適切な結果を得るために多くのチュートリアルやページに行きますが、できませんでした。 実際に私はいくつかのファイル(doc、ppt、pdf、excelなど)を持つフォルダを持っています。そのフォルダ内でのみコンテンツを検索したいのですが、そのフォルダ内で結果が見つからない場合は、lucene.netを使用してフォルダをインデックスする方法

たとえば、私は何千ものファイル@ C:\ test を持つフォルダを持っています。ユーザーが "miller"を検索すると、すべてのドキュメントを検索する必要があります。結果は、その後、検出された場合には、その

検索テキストファイルのような結果を表示する必要が出現箇所 ミラーCのNO:\テスト\ 1 \ file.docの5 ミラーC:\テスト\ 1 \ 11 \ new.doc 2

私は適切な結果が得られていません。

+0

はあなたが何をしようとしているスレッドと何のステップ、それは失敗しているのは、/あなたが予期しない結果を得ている参照してください? – BrokenGlass

答えて

1

Lucene/Lucene.NETは単なる索引付けエンジンです.Windowsでは多くのファイルタイプに対してIFilterインターフェイスを使用できます。Acrobatを使用している場合は、自分自身をサポートしたいファイルタイプからテキストを抽出する必要があります。 Reader 7+がインストールされている場合、IFilter for PDFファイルのサポートが組み込まれている必要があります。インデックス部分自体については、多くのサンプルがあります。

また、このWhat's a good method for extracting text from a PDF using C# or classic ASP (VBScript)?

関連する問題