私は、複数ページのPDFから1ページあたりにTIFFを抽出する必要があるプロジェクトに取り組んでいます。 PDFには画像しか含まれておらず、1ページに1枚の画像があります(私は彼らがある種の複写機/スキャナで作られたと信じていますが、これを確認していません)。 TIFFは、ドキュメントの他のいくつかの派生バージョンを作成するために使用されるので、解像度が高くなればなるほど。PDFからの高解像度画像
私は2つのレシピを見つけました。どちらも役立つ面がありますが、いずれも理想的ではありません。誰かが私の1つを調整したり、3つ目のオプションを提供したりするのを助けることができます。
レシピ1、pdfimagesとのImageMagick:
まず実行します(foo-000.pbm
名付け、foo-001.pbm
).pbm
いくつかのファイルになり
$ pdfimages $MY_PDF.pdf foo"
など
次に、各*.pbm
のためにdo:
$ convert $each -resize 3200x3200\> -quality 100 $new_name.tif
プロ:結果のTIFFファイルは
コン(-resizeだけですべてを正常化するのに役立つ)、長い寸法に健康3300+ピクセルです:ページの向きが失われ、彼らが出てくるには、(異なる方向に回転させます彼らは論理的なパターンに従っているので、恐らくスキャナに供給された向きであるでしょうか?)。
レシピ2 ImageMagickのソロ:
convert +adjoin $MY_PDF.pdf pages.tif
これは私(などpages-0.tif
、pages-1.tif
、)ページあたりのTIFFを与えます。
プロ:オリエンテーションはそのままです!
Con:結果のファイルの長さは、< 800 pxです。これは小さすぎて便利ではないようですが、圧縮が適用されているように見えます。
イメージストリームのスケーリングをPDFで取り除くことはできますが、その向きは保持できますか?私が紛失しているImageMagickにもっと魔法がいくつかありますか?何か完全に?
フリーではないソリューションを使用しますか? – BitBank
多分 - それはAPI(GUIなし)を持ち、統合するのに合理的である必要があります。私は何万ものドキュメントを取り扱っています。あなたはどう思いますか? – JStroop
詳細を私に書いてください。私が助けることができるかどうかが分かります([email protected])。 – BitBank