私はTesseractを試していて、2度目の試行ですでに失敗しています。なぜTesseractは簡単な単語を認識しませんか?
結果は常に空の文字列です。ここで
は、画像ファイルです。コードは次のようになります。
from pytesseract import image_to_string
image_file = Image.open('image.png')
print(image_to_string(image_file))
ノー成功を収めて再び
をimage.png
ターミナルたTesseractから直接も試してみました。この画像に問題がありますか、間違っているですか?
私はUbuntu 14.04をapt-getとともにインストールしたTesseractとpipを使ってインストールしたpytesseractを使用しています。
Pythonのバージョンは:3.4
は、私はまた、元の画像とは、結果を取得していません。元のイメージがテキストを囲む余分なパディングを含まないようにテセラクトを与える前に切り取られた場合、テセラクトの結果はほぼ常に100%です。私はそれがなぜそのように動作するのかを正確には伝えることはできませんが、背景色とテクスチャが前処理フェーズを混乱させるかもしれないと仮定しています。私はtesseractを供給する前にセグメンテーションアルゴリズムを持つことをお勧めします。説明をした後で追加の情報を追加すると、なぜそれがあなたの画像でうまく動作しないのでしょうか。 – Arsen