2012-03-14 19 views
1

私はtesseract OCR(光学式文字認識)を使用するアンドロイド用のアプリケーションを開発しており、小さなテキストの結果を改善する方法があるかどうか疑問に思っていました。AndroidでTesseractの結果を改善する

私は自分の頻繁で普通の単語リスト(wordlist2dawgを使って)で標準辞書を再コンパイルしようとしましたが、改善は見られませんでした。私はまた、tesseractが辞書の単語を使用する閾値を変更することは可能だと聞いてきましたが、これをどうやって行うのか分かりません。

私が結果をどのように改善できるか考えている人がいたら、私にはtesseractが私に与えてくれて本当にありがとう!

答えて

3

私はあなたを助けるかもしれないいくつかのオプションを知っている:

  1. 画像境界とテキストの間の余分なスペースを追加します。 Tesseractは、画像内のテキストがエッジに配置されていると、ひどくうまく動作します。
  2. 画像を複製します。たとえば、単語 'foobar'でOCRを実行している場合、画像を複製して 'foobar foobar foobar foobar foobar foobar'をtesseractに送信すると、結果が改善されます。
  3. Googleのフォントトレーニングとtesseractの画像の2進化

は覚えておいて、その内蔵カメラのモバイル機器で主に生産する低品質の画像(blured、雑音除去、スキューなど)OCR自体がリソースcomsumingプロセスであり、あなたはそれに値する画像前処理を追加した場合、ローエンドおよびミッド・モバイル・デバイス(アンドロイドを持つ可能性が高い)は、予期せずパフォーマンスが低下したり、リソースが不足する可能性があります。無料の/学習プロジェクトであれば問題ありませんが、商用アプリケーションを計画している場合は、より優れたSDKの使用を検討してください。 OCR for android

+1

すべての良い提案:

は、詳細については、この質問を見てください。もう1つの提案は、実際のOCRの前に小さなテキストの問題を「修正」することです。画像はx、y方向に2倍または3倍(比例)に拡大または拡大することができ、多くのOCRエンジンで読み易い大きな画像を生成できます。イメージヘッダにdpiを上書きせずに新しいピクセルを作成できるイメージングライブラリを使用する必要がありますが、これは比較的簡単な前処理です。 –

関連する問題