なぜTesseractは簡単な単語を認識しませんか？

私はTesseractを試していて、2度目の試行ですでに失敗しています。なぜTesseractは簡単な単語を認識しませんか？

結果は常に空の文字列です。ここで

は、画像ファイルです。コードは次のようになります。

from pytesseract import image_to_string 

image_file = Image.open('image.png') 
print(image_to_string(image_file))

ノー成功を収めて再び

をimage.png

ターミナルたTesseractから直接も試してみました。

この画像に問題がありますか、間違っているですか？

私はUbuntu 14.04をapt-getとともにインストールしたTesseractとpipを使ってインストールしたpytesseractを使用しています。

Pythonのバージョンは：3.4

出典

2016-09-04 Vahagn

は、私はまた、元の画像とは、結果を取得していません。元のイメージがテキストを囲む余分なパディングを含まないようにテセラクトを与える前に切り取られた場合、テセラクトの結果はほぼ常に100％です。私はそれがなぜそのように動作するのかを正確には伝えることはできませんが、背景色とテクスチャが前処理フェーズを混乱させるかもしれないと仮定しています。私はtesseractを供給する前にセグメンテーションアルゴリズムを持つことをお勧めします。説明をした後で追加の情報を追加すると、なぜそれがあなたの画像でうまく動作しないのでしょうか。 – Arsen

グレースケールまたはモノクロフィルタを適用した後、それが "！DDownload" を生産しました。

出典

2016-09-04 16:55:56 nguyenq

this文書では、これらに興味深いリンクが見つかりましたadvicesこれは参考にしてください。アドバイスページのセクション「4画像の準備」を参照してください。

より高度なOCRプログラムは、この自体を行うだろう。間違いなくTesseract が改善されます。

出典

2016-09-04 21:14:26 Arsen

なぜTesseractは簡単な単語を認識しませんか？

答えて

関連する問題