大きな(> 300MB)PDFファイルから画像を抽出する方法を研究しています。私はpdfboxを使用していますが、わからないいくつかの特定の理由で、一部のページが正しく抽出されていません。Javaを使用してpdfから画像を抽出する方法(pdfboxを使用しない)
私はコードのベースとしてpdfboxのPDFToImageクラスを使用しています。
私はこれを行うのに役立つ別のライブラリを知っていますか?私はiTextを使用することができることを知っていますが、私はそれが商用製品に使用することはできないことをお読みください。
パッケージxpdfとxpdf-utilsをインストールしました。pdfimagesというユーティリティが完璧に動作しています。しかし、私はこの問題をJavaから解決する必要があり、移植可能でなければなりません。
xpdf-utilsをJavaに移植することができます。 – erjiang
あなたが商用ライセンスを購入しない限り、iTextはGPLの下にあります。 –
私はバージョン<5を試してみます、ライセンス条件の変更がバージョン> = 5のバージョンで変更されたと思います。 –