2015-12-11 16 views
14

私はpytesseractを使用していますが、いくつかのGoogleグループソリューションを見ていますが、私にとってはうまくいかないようです。pytesseractは指定されたファイルを見つけることができません

私のコードは、まっすぐ進むと以下の通りです:

from PIL import ImageFilter 
import sys 
from PIL import Image 
import PIL.ImageOps  
import pytesseract 
import time 


image=Image.open("C:/temp/download.png") 
image.load() 
background = Image.new("RGB", image.size, (255, 255, 255)) 
background.paste(image, mask=image.split()[3]) # 3 is the alpha channel 
background.save('C:/temp/foo.jpg', 'JPEG', quality=80) 


img =Image.open('C:/temp/foo.jpg') 
img.load() 
print img 
print '-------------------' 
i = pytesseract.image_to_string(img) 
print i 

と私は戻って取得エラー応答は次のとおりです。

Traceback (most recent call last): 
    File "img.py", line 20, in <module> 
    i = pytesseract.image_to_string(img) 
    File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 161, in image_to 
_string 
    File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 94, in run_tesse 
ract 
    File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py", 
line 710, in __init__ 
    errread, errwrite) 
    File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py", 
line 958, in _execute_child 
    startupinfo) 
WindowsError: [Error 2] The system cannot find the file specified 

どれ指導は素晴らしいだろう。私のパス変数にたTesseractを追加

は助け: C:\Program Files (x86)\Tesseract-OCR

しかしpytesseractピースを実行しようとしたときにコードがクラッシュします。

+0

あなたはPythonでたTesseractを使用するには、この別のライブラリを使用して試すことができます:[pyslibtesseract](https://github.com/brunomacabeusbr/pyslibtesseract)。このライブラリは別の方法で画像を読み込みます。 – Macabeus

答えて

38

ちょうど同じエラーがヒットし、この質問に答えることにしました - それは、誰かが時間を節約するために役立つかもしれない...

まず、あなたがinstalled/copied Tesseract-OCR executablesがあることを確認してください。

PATH環境変数で指定されたディレクトリに、実行可能ファイルtesseractが見つかりません。だから、どちらかあなたのPATH変数にtesseractを含むディレクトリがあることを確認してか、次のようのようなあなたのPythonスクリプトでtesseract_cmd変数を上書きする(代わりにあなたのPATHを置く):その点を確認しTESSDATA_PREFIXのWindows環境変数の他に

import pytesseract 

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract' 

をディレクトリに設定され、ディレクトリはtessdataです。たとえば:

TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR 

tessdataかの場所は次のとおりです。C:\Program Files (x86)\Tesseract-OCR\tessdata

+4

コメントするには、tesseract FIRSTをインストールしてPythonの部分を試してみることをお勧めします。 –

+2

@jasonm、私は私の答えを更新しました。実際に私はそれについて言及することはあまりにも明白だと思ったが、ちょっと、あなたは正しい - それは経験の浅いユーザーを混乱させるかもしれない。 – MaxU

+0

@Jamie Bullパスのアドバイスに従いましたが、テッサデータラインを見つけることができません – Brandon

関連する問題