0
私は複数のPDFファイルをスキャンするためにtess4jを使用しようとしています。私は、各ページの上半分を(実際には、さらに少ないが、引数のために)スキャンで唯一興味を持っています。しかし、問題を迅速に起因するtess4j doOCRの四角形の座標はどうですか?
PdfUtilities.splitPdf(imageFile, outputFile, startPage, endPage);
List<IIOImage> imageList = ImageIOHelper.getIIOImageList(outputFile);
String result = instance.doOCR(imageList, null);
:私は、次のコードを使用します。 APIは、私が現在渡している場所をnull
と指定していますが、Rectangle rect
を渡すことができますが、四角形の座標が参照するものは参照していません。差があれば、PDFはさまざまなプロバイダから提供されます。