2009-05-04 12 views
6

出力PDFに変換する入力PDFファイル(通常はpdfTeXで生成されるとは限りません)があります。これは視覚的には同等で(解像度に関係なく)同じメタデータ(Unicodeテキスト情報、ハイパーリンク、アウトラインなど)、ファイルサイズはできるだけ小さい。次の方法について私が知っているPDFファイルのサイズを最適化するには?

  • java -cp Multivalent.jar tool.pdf.Compress input.pdfhttp://multivalent.sourceforge.net/から)。これにより、すべてのストリームが再圧縮され、未使用のオブジェクトが削除され、同等のオブジェクトが統合され、空白が圧縮され、デフォルト値が削除され、相互参照表が圧縮されます。
  • jbig2とPNGOUTで適切なイメージを再圧縮する。
  • タイプ1フォントをCFFフォントとして再エンコードします。
  • 同等の画像を統一する。
  • 同じフォントのサブセットをより大きなサブセットに統一します。
  • 入力可能なフォームを削除します。
  • 蒸留などの方法で変換する場合(例:gs -sDEVICE=pdfwrite)は、画質が低下せず、画像サイズを増やさない(!)ことを確認してください。

私は、次の技術について知っているが、私はすでにPDFを持っているので、彼らは、私の場合には適用されません。

  • は小さく、および/または以下のフォントを使用してください。
  • ビットマップイメージではなくベクターイメージを使用します。

PDFを最適化する方法はありますか?

+2

現在の多価:http://downloads.sourceforge.net/project/multivalent/multivalent/Release20091027/Multivalent20091027.jarには、tool.pdf.Compressクラスがありません。これについては、http://sourceforge.net/p/multivalent/discussion/252478/thread/e7850c31/?limit=50#a96dを参照してください。あなたは良い代替工具を知っていますか? –

+0

古い多価バージョンはArch Linuxに存在します:https://aur.archlinux.org/packages/multivalent-pdf-tools/ –

答えて

10

最適化PDFファイル

リフライドグラフィックビットマップとして挿入されなければならないグラフィックス

は、最大圧縮率と最小寸法のためにそれらを準備避けます。 PDFの出力解像度でできる最高の品質の画像を使用してください。圧縮されたJPEGをPDFに挿入し、それらを保存するとJPEGが再圧縮され、目立ったアーチファクトが発生する可能性があります。単色圧縮に優れた新しいJBIG2規格を使用するには、カラー画像の代わりに白黒画像とテキストを使用します。ウェブ用にPDFを保存するときは、必ずサムネイルをオフにしてください。 ベクトルグラフィックスを使用する

可能な限り、通常はGIF形式の画像には、可能であればベクトルベースのグラフィックスを使用してください。ベクトル画像は完全に尺度が変わって見事に見えますが、その数式は通常、ビットマップグラフィックスがベクトルグラフィックスよりも小さい場合がありますが、すべてのピクセルを記述するビットマップグラフィックスよりも少ないスペースを占めます。 PDFフォーマットに組み込まれているZIP圧縮を使用してベクター画像データを圧縮することもできます。 Acrobat Readerバージョン5および6もSVG標準をサポートしています。 フォントの最小化

フォントの使用方法、特にPDFのサイズが小さい場合は、ファイルサイズに大きな影響を与える可能性があります。ドキュメントで使用するフォントの数を最小限に抑えて、ファイルサイズへの影響を最小限に抑えます。追加の完全に埋め込まれたフォントは、ファイルサイズで40Kを簡単に取ることができます。そのため、ほとんどの著者は、実際に使用されているグリフのみを含む「サブセット化」フォントを作成します。 脂肪フォームの整理

Acrobatフォームは、PDF内に多くのスペースを占めることがあります。 Acrobat 8​​ Proの新機能では、[詳細設定] - > [PDFオプティマイザ] - > [オブジェクトの破棄]ダイアログボックスでフォームフィールドを平坦化できます。フォームを平坦化すると、フォームフィールドは使用できなくなり、フォームデータはページとマージされます。また、ApagoのPDF Enhancerを使用して、ファイルに存在する情報を削除してフォームを50%削減することもできますが、実際には使用されません。改ざんされたPDFと古いフォームページを組み合わせて、AcrobatでハイブリッドPDFを作成することもできます(下記の「改訂PDF」を参照)。

圧縮、オブジェクトストリームとクロスリファレンスストリームの2つの新しいメソッドがあるPDF仕様バージョン1.5〜

+0

+1 vote。リンクと抜粋をありがとう。私のPDFをさらに小さくすることはできませんでしたが(言及されたすべてのテクニックが使用されているか、私の場合には当てはまりません)、それは良い洞察を与えます。 – pts

4

articleを参照します。

Multivalent.jar圧縮ツールが相互参照テーブルを圧縮すると言います。これは、通常、相互参照表がストリームに変換されてから圧縮されることを意味します。

この相互参照ストリームの形式は固定されていません。データの3つの「列」のビットサイズを変更することができます。また、データの圧縮レベルを向上させる予測関数を使用してストリームデータを前処理することもできます。テキストエディタでPDFを見ると、相互参照ストリーム辞書に/Predictorというエントリがあり、使用しているツールがこの機能を利用しているかどうかを確認できます。

圧縮率を予測すると画像にも便利です。

提供される第2のタイプの圧縮は、オブジェクトストリームの使用です。

多くの場合、同じようなオブジェクトがあります。これを1つのオブジェクトに結合して圧縮することができます。多価圧縮ツールのドキュメントには、オブジェクトストリームが使用されているが、グループ化するオブジェクトの実際の選択に関する詳細はほとんど含まれていないことが記載されています。類似のオブジェクトをまとめてオブジェクトストリームにまとめると、圧縮率が向上します。

関連する問題