2009-04-03 14 views
1

高解像度と小さなPDFファイルサイズを目指して、文字をスキャンしてスキャンしたビットマップをPDFに変換するシステムを試しています。PS/PDFはどのようにビットマップを保存し、圧縮しますか?

私はスキャナー、ビットマップ操作用のGIMP、ビットマップからPDFへの変換用のImageMagickでプロトタイプを作成しています。次のように

私のプロセスが見えます:3x8bit色の

  • スキャン、600 DPI、 LZW圧縮トゥルーカラーTIFFファイル サイズは約8 MBです。

  • GIMPを使用して、ビットマップを というインデックス形式の画像に変換します。一般的なカラーテーブルは、4色〜8色です。これにより、画像がより圧縮されやすくなります。

  • ImageMagickを使用して、 LZW圧縮インデックス付きTIFFファイルPDF、 をページあたり約500Kで変換します。

画像をさらに圧縮しやすくするために、ビットマップをより圧縮しやすくすることができました。ここで実験する前に、PS/PDFがビットマップをどのように格納するかを知りたいと思います。

PS/PDFのビットマップは、ランレングスエンコードされていますか?次に、ビットマップ行から単一のピクセルを削除して圧縮を得る。

ここでさらに最適化するためのアイデアはありますか?

PS/PDFでビットマップ記憶形式の参照を知っていますか?

答えて

0

、IIRC、PDFはデフレートを使用しています。しかし、PDFは、JPEG(ロッシー)、CCITT(ロスレス)、JBIG2(ロッシーおよびロスレス)、JPX(JPEG2000、ロッシーおよびロスレス)などのより特定の画像圧縮アルゴリズムを使用して画像を保存することもできます。

0

Adobe's PDF referenceは、開始するのに適しているかもしれません。非常に単純な外観から見ると、画像は圧縮されていないように保存されているように見えますが、まったく気になりません。また、JPEGなどの外部画像にリンクすることもできます。

0

圧縮方法は、一般にPDFを作成するツールによって選択され、その制御方法は限定されている場合があります。

Acrobat 9.0をお持ちの場合、本当に素敵な「隠し」機能があり、PDF内のオブジェクトツリーを見ることができます(リソースのXObjectsに興味があります)。 http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

1

いくつかの企業(私が知っているのはLuratechとCamiNovaだけです)が、PDFで "Mixed Raster Content"モデルを作っています。ファイルは標準のAdobe Readerで表示できますが、DjVuに匹敵する非常に小さいです。

「混合ラスタコンテンツ」は、画像を高解像度のB & Wマスク(ハードエッジ、ライン、文字)と低解像度のスムーズトーン画像(背景画像)に分割することを意味します。マスクはバイナリ圧縮アルゴリズム(おそらくJBIG2)を使用して格納され、平滑なトーン画像はJP2K(おそらく)を使用して圧縮されます。

関連する問題