2009-04-03 4 views
9

私は、ファックス、携帯電話カメラの画像、および可読性とOCRのための他の同様のソースを強化するためのアルゴリズム、論文、またはソフトウェアを探しています。文書のOCR /可読性のための画像処理/拡張アルゴリズムですか?

私は主に単純な機能強化(ImageMagickを使ってできることなど)に興味がありますが、私はより洗練された技術にも興味があります。私は既にベンダーと話しているので、この質問ではアルゴリズムやオープンソースソフトウェアを探しています。

私はOCRのソフトウェアやアルゴリズムを探しているわけではありません。私は人間の目に見やすく見えるように画像をクリーンアップするためのアルゴリズムを探していて、おそらくOCRに使用することができます。

要求されたよう

答えて

2

、ウィキペディアにリンクされていますOptical character recognition

マイクロソフトリサーチ:Optical character recognition papers

CiteSeerX:Papers on optical character recognition私は本のスキャンを行うにはいくつかのソフトウェアを書いていた同様の問題があった

+0

ウィキペディアの記事へのポインタが役立ちます。 – Parand

+0

ええ、私は記事がどこにあるのかも知りたいです。 –

5

。インターネット上に浮かぶのはpagetoolsと呼ばれるプログラムで、ラドン変換と呼ばれるかなり巧妙な数学的技法を使ってスキャンインページを整えるものです。

私はまた、ページの空白を白くする小さなルーチンを書きました。 OCRアルゴリズムは、バックグラウンドノイズと対立する必要がない場合には、より良い傾向があります。私がやったことは、暗い色のものから小さな半径のものよりも明るい色のピクセルを探し、それらを純粋な白にすることでした。

しかし、数年後には、正確な実装の詳細がわかりません。

4

簡単な画像フィルタは、非常に簡単で、自分自身を実装しやすいフィルタ「メジアンフィルタ」です。スキャンして撮影したテキストをクリーンアップするのに役立ちます。 http://en.wikipedia.org/wiki/Median_filter

関連する問題