2012-03-07 15 views
2

私は多くのテキストページ(白い背景に黒いテキスト)をスキャンしています。ImageMagickを使ってスキャンしたグレースケール画像をクリーニングする

私の通常のアプローチは、わずか4ポイントと非常に単純曲線を使用してカーブダイアログを使用してGimpの中にそれらをきれいにすることです:0,0 - 63,0 - 224255、255255

これは、すべての灰色がかったテキストピッチは黒になりプラスはテキストをシャープにし、白いピクセルのほとんどを純粋な白に変えます。

ImageMagickまたはコマンドラインから完全に実行される他のLinuxツールを使用してスクリプトで同じ効果を達成するにはどうすればよいですか?

-normalizeまたは-contrast-stretchは、ピクセルカウントで動作するため動作しません。私は色0-63(グレースケール)の黒を作ることができる演算子が必要です、224以上のすべてが純粋な白で、残りは正規化されるべきです。

答えて

4

The Color Modifications pageは、ImageMagickによる多くの色操作アルゴリズムを示しています。この特定のケースで

、2つのアルゴリズムは、興味深いものです:

-levelはあなたの曲線との間の線形分布の両端近くの黒/白画素を与えます。

Sigmoidalオプションを使用すると、極端な部分が滑らかになり、カラー写真の方が効果的です。

GIMPのような同様の結果を得るには、テキストと黒の領域を本当に黒くするために、順番に適用してみてください。

すべての場合、最初に-normalize(またはノイズのほとんどをマージするには-contrast-stretch)を実行して、黒/白のレベルが無駄にならないようにします。これがなければ、最も暗い色はrgb(0,0,0)よりも明るくなり、最も明るい色は純粋な白より下になります。

+7

私は大量のDoréWoodcuttingsをスキャンして、 'for file in *;で正常に変換しました。 mogrify -normalize -level 27%、76%$ file;完了しました。私はgimpの曲線ツールを試して27%と73%を見つけました。 – berkes

関連する問題