私は文書管理プロジェクトに取り組んでいます。私はpdfからテキストを抽出したいと思います。どうすればこれを実現できますか?私はItextsharpを使ってローカルシステム上でpdfを展開しています これは私がこの目的のために使用している関数です。パスは、それは例外 'ftp:\\###\index\500199.pdf not found as file or resource.'
をスローF
私の問題は、最後の(タイムスタンプ式の)索引付けされたLuceneドキュメントを取得するための最速の方法を見つけることにあります。ここで は、文書内のフィールドがどのように見えるかです: // Index file contents
Field contentField = new Field(
FieldContent,
message.content,