私はpdftkを使用して、Nitro Readerによって作成された圧縮pdfストリームの情報を検査しようとしていますが、pdftkはストリームを圧縮解除しません。エラーは発生しませんが、pdfオブジェクトを並べ替えること以外は何もしないようです。 Hereは、これらのpdfsの最小の例です。pdftkはデータストリームを解凍しません
pdftk test.pdf output test-d.pdf uncompress
他のpdfsでpdftkを試してみるとうまくいくようです。データストリームを手動で抽出してPythonでzlibを使用して解凍すると、適切に解凍されます。また、Adobe Readerでpdfを開いて再保存すると、pdftkはpdfファイルで正常に動作します。
私は手作業でニトロのpdfを自分の能力で検査しましたが、それは有効なpdfと思われます。私はここで何が起こっているのか非常に混乱しています。
問題の背景として、私はこれらのpdfを何百も持っており、特定のキーワードを検索しようとしていますが、私が解凍を自動化できるならばできるはずです。
pdftkバージョン1.45
Windows 7のホームプレミアムSP1
ニトロリーダー2バージョン2.5.0.36
おかげで、 ジェームズ