2017-07-05 15 views
1

こんにちはOCR tesseractを使用して画像内の文字を認識しようとしています。私はImageMagickの画像を使用して変換をしたTesseractテキスト認識付きの簡単な画像ヘルプは画像を変換/変換したい

、元画像は良いが、その十分ではないように思わ:

enter image description here

ImageMagickのに使用されるコマンドを変換するために、

convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg 

結果画像:

enter image description here

のOCRたTesseractコマンド:

$ tesseract output.jpg out -psm 7 

出力/結果:

テキスト:AUGU - > AUOU

Leptonicaと

たTesseractオープンソースのOCRエンジンv4.00.00alpha ページ1

テキスト:VEGU - > VOR-OU

0 Leptonica ページで

たTesseractオープンソースのOCRエンジンv4.00.00alpha 1

テキスト:EGUV - > E6UV

Leptonica ページで

たTesseractオープンソースのOCRエンジンv4.00.00alpha 1

テキスト: USEA - > USSOEA

+2

文字と数字が回転している可能性があります。私の理解は、OCRは一般的に回転文字が好きではないということです。それは、文字が正しく認識されるように適切な向きになることを期待しています。しかし、私はOCR専門家ではありません。だから、私はもっと知っているかもしれない他の人たちに任せます。 – fmw42

+0

継続:文字が回転していない例を試してください。それは動作しますか? – fmw42

+0

私はtesseractの他のバージョンで作業している、ありがとう! –

答えて

0

純粋な運があったかどうかわかりません。テストする画像は1つのみですが、きれいなPNGの代わりにノイズの多い/かすかなJPEGを使用していることがわかりました。画像を50%で作成し、PNGをi 4文字すべて正しく認識します:

convert yourImage.jpeg -threshold 50% clean.png 
tesseract -psm 7 clean.png out 
+0

試してみて、成功していないと、どのバージョンのtesseractを使用しましたか? 結果はUSO 'だった:A' –

+0

は' $ image_test.jpgを変換するには、50%のclean.png' たTesseractオープンソースout.txt' -psm 7 &&猫をclean.png '$のたTesseractを-threshold OCRエンジンv4.00.00alpha with Leptonica 警告。無効な解像度0 dpi。代わりに70を使用します。 uso:A' –

+0

その他の画像はこちら[画像](http://imgur.com/a/eZeRk) –

関連する問題