パンのカードイメージをすべての反復で20pxずつ増加させて切り取っています。 ocrは行っていますが、画像処理の方が良い解決策を持っているか、または cv2のような別のライブラリが役に立ちましたら、output.ifでノイズが発生しています。私たちはtesseractを使ってパンOCRを行っていますが、名前とパン番号のような詳細を検出することはできません
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
im = Image.open("image/testpan.jpg")
width = im.size[0]
height = im.size[1]
print('width,height-->',width,height)
yy='img'
zz='.jpg'
x=0
for j in range(x,height):
img2 = im.crop((0, x, width/2,x+70))
img2.save(yy+str(j)+zz)
img = Image.open(yy+str(j)+zz)
# img = img.convert("L")
img.save(yy + str(j) + zz)
text = pytesseract.image_to_string(Image.open(yy+str(j)+zz))
print('IIIII',j, text)
x=x+20
j=x
if j>height:
break
ファーストを灰色に。それであなたの関心領域がどのように見え、どのようなテッサラクトがそれをどのように解釈するかを見てください。このような提案をするのは難しいです。 – lamandy
トリミングされた画像とそれに対応するOCR結果を提供できる場合に役立ちます。 – lamandy
あなたのレスポンスのためにlamandyに感謝します。 –