私は数字に解析したいおおよそこの形式の画像を持っている: Pythonの3 OCR
を私はpytesseract
モジュールを使用しようとしましたが、結果が欠けていることが判明しています。場合によっては5
は6
と続きます。私はまた、一般的に0
と解釈されたので、色のついた円を手動で検出することを強いられました。
サンプルコードを使用:
import pytesseract
from PIL import Image
img = Image.open("foo.png")
print(pytesseract.image_to_string(img))
> 150150150
は、私は、例えば、黄色の円がyellow
、たとえば、として表現されるカスタム文字にマップする、ことを指定することができます方法はありますか?サンプルイメージを解析すると期待される結果は、15 yellow 15 gray 15 brown
のようなものになります。フォントはほとんど一定で、背景色のみがわずかに変化するため、手動でフィードする数字の画像でtesseractを訓練する方法があります実際の画像を特定する前にそれを使用しますか?