私はTesseract OCR(pytesser経由)とPIL(Python Image Library)を使ってアプリケーションの自動テストを行っています。OCRソフトウェアを成功させるにはどうすればいいですか?
私は、スクリーンショットを作成し、tesseractのおかげでテキストを取得することで、表示されたテキストがOKであることを確認しています。
私は最初にいくつかの問題があり、PILのバイキュービック補間のおかげでスクリーンショットのサイズを増やしたので、よりうまくいくように思えます。
残念ながら、私はまだ '0'と 'O'の間に混乱のようないくつかの間違いがあります。私は将来、他の同様の問題があると思います。
OCRを支援するために画像を準備する技術があるかどうかを知りたいと思います。どんなアイデアも歓迎されます。 0とOを区別するための事前
この質問はまだ関連の場合:これは、たTesseractでなければなりませんか?低品質の入力画像に最適なOCRエンジン(ABBYYなど)があり、自動的に画像の前処理を行います。 http://www.wisetrend.com/wisetrend_ocr_cloud.shtmlでABBYYエンジンを使用するOCR用のREST APIがあります。無料の試用版を用意していますので、あなた自身でいくつかの画像を試すことができます –