2011-07-12 11 views
0

TesseractのJavaライブラリCalled Tess4jを使用して、PDFファイルをテキストに変換しています。 Tiffファイルと1ページのPDFファイルでうまく動作します。しかし、複数ページのPDFでは、出力ファイルが生成されます。最後のページになると、doOCR呼び出しを呼び出した元のアプリケーションに制御が戻ってこないようです。何もせずにそこに留まるだけです。 返されないネイティブコールに問題がありますか。手がかりがありません。tesseract ocr multipage pdf hangs

可能な限り早急に解決策があるかどうか教えてください。

よろしく
Vish

答えて

0

Tess4Jは、複数ページのPDFとマルチページTIFFをサポートしています。単体テストの場合はPDFファイルに置き換えて試してみてください。