私たちはtesseractを使ってパンOCRを行っていますが、名前とパン番号のような詳細を検出することはできません

パンのカードイメージをすべての反復で20pxずつ増加させて切り取っています。 ocrは行っていますが、画像処理の方が良い解決策を持っているか、または cv2のような別のライブラリが役に立ちましたら、output.ifでノイズが発生しています。私たちはtesseractを使ってパンOCRを行っていますが、名前とパン番号のような詳細を検出することはできません

import pytesseract 
from PIL import Image, ImageEnhance, ImageFilter 

im = Image.open("image/testpan.jpg") 
width = im.size[0] 
height = im.size[1] 
print('width,height-->',width,height) 

yy='img' 
zz='.jpg' 

x=0 
for j in range(x,height): 
    img2 = im.crop((0, x, width/2,x+70)) 
    img2.save(yy+str(j)+zz) 

    img = Image.open(yy+str(j)+zz) 
    # img = img.convert("L") 
    img.save(yy + str(j) + zz) 
    text = pytesseract.image_to_string(Image.open(yy+str(j)+zz)) 
    print('IIIII',j, text) 

    x=x+20 
    j=x 
    if j>height: 
     break

出典

2017-12-08 Alkesh Mahajan

ファーストを灰色に。それであなたの関心領域がどのように見え、どのようなテッサラクトがそれをどのように解釈するかを見てください。このような提案をするのは難しいです。 – lamandy

トリミングされた画像とそれに対応するOCR結果を提供できる場合に役立ちます。 – lamandy

あなたのレスポンスのためにlamandyに感謝します。 –

この[OK]をしていますか？

変換は、最初の関心領域を識別するために、あなたのコードを取得し、すべての
threshold
findContours
boundingRect

出典

2017-12-08 08:08:04 Silencer

どうすればいいか教えてください。 –

@AlkeshMahajan https://stackoverflow.com/questions/47707200/how-to-improve-the-accuracy-to-get-those-separate-box?noredirect=1#comment82377263_47707200あなたは2人がtesxxxを使ってOCRを行います。 ROIを検出するには、tesxxxに役立つかどうかわかりません。 – Silencer

ありがとう、私たちはこれを試してみます。 –

私たちはtesseractを使ってパンOCRを行っていますが、名前とパン番号のような詳細を検出することはできません

答えて

関連する問題