Tesseractテキスト認識付きの簡単な画像ヘルプは画像を変換/変換したい

こんにちはOCR tesseractを使用して画像内の文字を認識しようとしています。私はImageMagickの画像を使用して変換をしたTesseractテキスト認識付きの簡単な画像ヘルプは画像を変換/変換したい

は

、元画像は良いが、その十分ではないように思わ：

ImageMagickのに使用されるコマンドを変換するために、

convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg

結果画像：

のOCRたTesseractコマンド：

$ tesseract output.jpg out -psm 7

出力/結果：

テキスト：AUGU - > AUOU

Leptonicaと

たTesseractオープンソースのOCRエンジンv4.00.00alpha ページ1

テキスト：VEGU - > VOR-OU

0 Leptonica ページで

たTesseractオープンソースのOCRエンジンv4.00.00alpha 1

テキスト：EGUV - > E6UV

Leptonica ページで

たTesseractオープンソースのOCRエンジンv4.00.00alpha 1

テキスト： USEA - > USSOEA

出典

2017-07-05 J. Metal

文字と数字が回転している可能性があります。私の理解は、OCRは一般的に回転文字が好きではないということです。それは、文字が正しく認識されるように適切な向きになることを期待しています。しかし、私はOCR専門家ではありません。だから、私はもっと知っているかもしれない他の人たちに任せます。 – fmw42

継続：文字が回転していない例を試してください。それは動作しますか？ – fmw42

私はtesseractの他のバージョンで作業している、ありがとう！ –

純粋な運があったかどうかわかりません。テストする画像は1つのみですが、きれいなPNGの代わりにノイズの多い/かすかなJPEGを使用していることがわかりました。画像を50％で作成し、PNGをi 4文字すべて正しく認識します：

convert yourImage.jpeg -threshold 50% clean.png 
tesseract -psm 7 clean.png out

出典

2017-07-05 09:33:36

試してみて、成功していないと、どのバージョンのtesseractを使用しましたか？結果はUSO 'だった：A' –

は' $ image_test.jpgを変換するには、50％のclean.png' たTesseractオープンソースout.txt' -psm 7 &&猫をclean.png '$のたTesseractを-threshold OCRエンジンv4.00.00alpha with Leptonica 警告。無効な解像度0 dpi。代わりに70を使用します。 uso：A' –

その他の画像はこちら[画像]（http://imgur.com/a/eZeRk） –

Tesseractテキスト認識付きの簡単な画像ヘルプは画像を変換/変換したい

答えて

関連する問題