2012-05-09 2 views
0

可能性の重複:
How to index pdf, ppt, xl files in lucene (java based or python or php any of these is fine)?がどのようにpdfファイル内の文字列を検索する

私はフォルダ内のファイルのコレクション内の文字列を検索する必要があり

がdocxファイル、PDFファイルを含み、 txtフォーマット。 lucene.netを使用して文字列を検索することは可能ですか?

は、このために役立ついくつかの参照を与えてください。..

をuに感謝..

答えて

5

あなたは様々なファイル(PDF、DOCX、TXT)のテキストを抽出し、そのにそのテキストを挿入する必要がありますLucene指数に変換する。 Luceneには、様々なドキュメントフォーマット

一般的に「.NETのエキス{ドキュメント形式}テキスト」を検索していない、あなたがすべきたくさんのリソースを見つけてください。

関連する問題