OCRエンジンとしてOpenCVとtesseractを使用して識別バッジを読み取るアプリケーションを開発しています。 OpenCVを使ってアルゴリズムを書いています.OpenCVは、OCRエンジンのクリアで「読みやすい」イメージを得るためにテキスト検出を処理します。私は私が何を得るilustrateするには、以下の画像を追加します。tesseract OCR-QがOとして検出されました
私は画像を「読み」するたTesseractを頼むとき、私は「KO 978」を取得...と、この「O/Qの問題」を検索しますtesseract、私はこのポストhttps://groups.google.com/forum/#!topic/tesseract-issues/kEDIIpQ-9W4だけを見つけましたが、ここでは、tesseractの入力イメージが明確に前処理されていないようです(応答はイメージが傾き補正されていないという応答です)...
wikiセクションに基づくgithubで、私は品質改善のすべてのステップを踏んだ(イメージがきれいだと思う)ので、私は他に何ができるかわからない... OCRのトレーニングが助けになるかどうかわからないそれは可能です、私はしたいですoこの作業を避けてください。また、ドキュメントでは推奨されていないためです。
私はコンソールでtesseract v3.03を使用しています。私のアプリケーションには統合されていません(tessarctは入力画像の前処理を行います)。
これを解決する方法はありますか?ありがとう!
これは役立つかもしれません:http://stackoverflow.com/questions/33624784/tesseract-thinks-my-1s-are-7s –
はい、おそらく私は手紙で手紙と後援者を比較しなければならないと思います。私はそれが助けることができると思う – user3368457