2011-08-02 13 views
2

信号処理用のJPEG量子化テーブルを最適化は、グレースケールのテキスト文書画像

私はJPEGまたはTIFF-JPEG形式でフルカラーテキスト画像を保存したいです。これらのイメージには、いくつかのカラーグラフィックを含むテキストドキュメントが含まれています。 JPEG品質レベルが非常に高い場合でも、テキストには多くのアーティファクトや劣化があります。

私は、サブサンプリング比と量子化マトリクスを含むJPEGエンコードパラメータを完全に制御しています。

私の質問は:

  • 私はテキスト文書には、これらのパラメータを最適化することはできますか? (品質レベルを超えて)
  • 画像のさまざまな部分に異なるパラメータ設定を適用できますか?
  • エンコードする前に、イメージのさまざまな部分の係数を手動で切り捨てる(量子化する)ことは役に立ちますか?

答えて

1

標準JPEGは非可逆で、あなたがそれについてできることは何もありません(後でだってオフィスでimgurにアクセスすることはできません。サンプル画像を添付します)。また、失われた情報は、自然な(滑らかな)イメージでは気付かれないはずです。

私の主なポイントは、人工的な画像ではロスレスコーデックを使用することです。無損失JPEGではなく、少なくともRLEをサポートするもの。たとえば、PNGまたはJPEG-LSのような画像ではるかに良い結果が得られます。

+0

ありがとうございました。個人的に私はあなたに同意します。残念ながら、私は現在の顧客のためのバランスを探すために支払われます - 彼らはJPEGの中品質と同等の圧縮率が必要ですが、テキストの外観を最適化したいと思います。 (同じページにグラフィックアートワークもあります。) – rwong

+0

@rwong:わかりました。後処理はどうですか? – ruslik

+0

画像はどの画像ソフトウェアでも読める必要があります。後処理の例を挙げることはできますか?スレッシュホールドに似ていますか?ありがとう。 – rwong

2

PDFを出力として使用したことはありますか? PDFを使用すると、黒と白のテキスト上でダイナミックしきい値を設定し、1-bpp CCITT G4として圧縮することができます。また、ページ上のカラーオブジェクトをキャプチャし、FLATEまたはJPEGで圧縮することもできます。 PDFページは、これらの2つのタイプのオブジェクトの複合オブジェクトです。あなたは最高の品質とより良い圧縮を得るでしょう。

1

私は、さまざまな方法でさまざまなコンテンツを圧縮するためにPDFを使用するという2番目のBitBankの提案 - これは「MRC」 - ラスタ混合コンテンツと呼ばれることがあります。多くの文献。

あなたの画像が合成画像であるかスキャンされた画像であるかは言いません。合成画像の場合、私の個人的な経験は、特にサンプル値を均質化するためにいくつかの(損失の多い)前処理をしたい場合、LZW(TIFFでさえ)ですばらしい仕事をすることができるということです。つまり、十分な類似の値を量子化して等価にすることができる場合です。

イメージをスキャンすると、LZWやその他のロスレス圧縮がトラクションを検出できるほど十分なイメージに前処理するのが非常に難しくなります。そのため、JPEGの損失は、全体的にも周波数領域でも非常に調整可能であることを、私はruslikのほぼ反対であると言います。もちろん、テキスト品質を選択的に改善するために量子化テーブルを調整することも可能である。私は専門家ではありませんが、私が覚えている起点は、Giordano Bruno Beretta氏の仕事です。& co。 HPラボで Method for selecting JPEG quantization tables for low bandwidth applications

関連する問題