0
tesseractが間違って認識した画像をいくつか見つけてください。Tesseract - おそらく簡単な画像が間違った番号に変わる
47は、 "4]" として認識されます。
55は、 "S55" として認識されています。
90は、 "IQ" として認識されています。
私は画像がかなり良いと思っていて、Tesseractが認識しやすいはずです。しかし結果は間違っていることが分かります。私が使用したコードを以下に示します。
import cv2
import pytesseract
from PIL import Image
import glob
for i in glob.glob('*.png'):
img = cv2.imread(i, 0)
tessdata_dir_config = '--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\" --psm 10'
result = pytesseract.image_to_string(Image.fromarray(img), config=tessdata_dir_config)
print result
何が起こっているのか、パフォーマンスを改善する方法は誰にも分かりますか?