OCRソフトウェアを成功させるにはどうすればいいですか？

私はTesseract OCR（pytesser経由）とPIL（Python Image Library）を使ってアプリケーションの自動テストを行っています。OCRソフトウェアを成功させるにはどうすればいいですか？

私は、スクリーンショットを作成し、tesseractのおかげでテキストを取得することで、表示されたテキストがOKであることを確認しています。

私は最初にいくつかの問題があり、PILのバイキュービック補間のおかげでスクリーンショットのサイズを増やしたので、よりうまくいくように思えます。

残念ながら、私はまだ '0'と 'O'の間に混乱のようないくつかの間違いがあります。私は将来、他の同様の問題があると思います。

OCRを支援するために画像を準備する技術があるかどうかを知りたいと思います。どんなアイデアも歓迎されます。 0とOを区別するための事前

2009-08-26 luc

この質問はまだ関連の場合：これは、たTesseractでなければなりませんか？低品質の入力画像に最適なOCRエンジン（ABBYYなど）があり、自動的に画像の前処理を行います。 http://www.wisetrend.com/wisetrend_ocr_cloud.shtmlでABBYYエンジンを使用するOCR用のREST APIがあります。無料の試用版を用意していますので、あなた自身でいくつかの画像を試すことができます –

恥知らずなプラグや免責事項：.NET

たTesseractで使用するためmy companyパッケージたTesseractはOK OCRエンジンです。それは多くを見逃す可能性があり、簡単に非テキストで混乱します。あなたのためにできることは、テキストだけを取得することです。次善策は、2値化（アダプティブまたはダイナミックスレッシュホールド）またはグレースケールに2値化を試み、2値化を試みることです。

フォント

メイク画像の余分な周りの清潔で十分な空き容量を持つ文字を認識する

出典

2009-08-26 18:56:15 plinth

私はそれに同意します。ダイアログボックスの端で混乱し、「I」に変換されました。テキストのみの画像を取得すると、うまくいく。二値化も良い考えです。ありがとう。 – luc