2017-12-08 5 views
0

パンのカードイメージをすべての反復で20pxずつ増加させて切り取っています。 ocrは行っていますが、画像処理の方が良い解決策を持っているか、または cv2のような別のライブラリが役に立ちましたら、output.ifでノイズが発生しています。私たちはtesseractを使ってパンOCRを行っていますが、名前とパン番号のような詳細を検出することはできません

import pytesseract 
from PIL import Image, ImageEnhance, ImageFilter 

im = Image.open("image/testpan.jpg") 
width = im.size[0] 
height = im.size[1] 
print('width,height-->',width,height) 

yy='img' 
zz='.jpg' 

x=0 
for j in range(x,height): 
    img2 = im.crop((0, x, width/2,x+70)) 
    img2.save(yy+str(j)+zz) 

    img = Image.open(yy+str(j)+zz) 
    # img = img.convert("L") 
    img.save(yy + str(j) + zz) 
    text = pytesseract.image_to_string(Image.open(yy+str(j)+zz)) 
    print('IIIII',j, text) 

    x=x+20 
    j=x 
    if j>height: 
     break 

original image

+0

ファーストを灰色に。それであなたの関心領域がどのように見え、どのようなテッサラクトがそれをどのように解釈するかを見てください。このような提案をするのは難しいです。 – lamandy

+0

トリミングされた画像とそれに対応するOCR結果を提供できる場合に役立ちます。 – lamandy

+0

あなたのレスポンスのためにlamandyに感謝します。 –

答えて

1

この[OK]をしていますか?

  1. 変換は、最初の関心領域を識別するために、あなたのコードを取得し、すべての
  2. threshold
  3. findContours
  4. boundingRect

enter image description here

+0

どうすればいいか教えてください。 –

+0

@AlkeshMahajan https://stackoverflow.com/questions/47707200/how-to-improve-the-accuracy-to-get-those-separate-box?noredirect=1#comment82377263_47707200あなたは2人がtesxxxを使ってOCRを行います。 ROIを検出するには、tesxxxに役立つかどうかわかりません。 – Silencer

+0

ありがとう、私たちはこれを試してみます。 –

関連する問題