私はpythonを使って画像からbangla文字を検出しようとしていますので、私は使用することを決めましたpytesseract。この目的のために、私は以下のコードを使用しました:pytesseractを使ってBangla文字を検出する
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
im = Image.open("input.png") # the second one
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
text = pytesseract.image_to_string(Image.open('temp2.png'),lang="ben")
print text
英語のイメージを与えれば、問題は検出されます。しかし、私がlang="ben"
と書いているときに、ベンガル文字のイメージから検出すると、私のコードは永遠の時間のように、あるいは永遠に動いています。
P.S:私はtessdataフォルダにベンガル語列のデータをダウンロードしていると私はPyCharmでそれを実行しようとしています。
誰でもこの問題の解決に手伝ってもらえますか?
私はそれが動作コマンドプロンプトでそれを試してみました。しかし、上記のコードは** pycharm **で書かれています。 ** pycharm **では無制限に動作します。 –
@pial上記のEDITを参照してください。 – thewaywewere