私はtesseract OCR(光学式文字認識)を使用するアンドロイド用のアプリケーションを開発しており、小さなテキストの結果を改善する方法があるかどうか疑問に思っていました。AndroidでTesseractの結果を改善する
私は自分の頻繁で普通の単語リスト(wordlist2dawgを使って)で標準辞書を再コンパイルしようとしましたが、改善は見られませんでした。私はまた、tesseractが辞書の単語を使用する閾値を変更することは可能だと聞いてきましたが、これをどうやって行うのか分かりません。
私が結果をどのように改善できるか考えている人がいたら、私にはtesseractが私に与えてくれて本当にありがとう!
すべての良い提案:
は、詳細については、この質問を見てください。もう1つの提案は、実際のOCRの前に小さなテキストの問題を「修正」することです。画像はx、y方向に2倍または3倍(比例)に拡大または拡大することができ、多くのOCRエンジンで読み易い大きな画像を生成できます。イメージヘッダにdpiを上書きせずに新しいピクセルを作成できるイメージングライブラリを使用する必要がありますが、これは比較的簡単な前処理です。 –