こんにちはOCR tesseractを使用して画像内の文字を認識しようとしています。私はImageMagickの画像を使用して変換をしたTesseractテキスト認識付きの簡単な画像ヘルプは画像を変換/変換したい
は
、元画像は良いが、その十分ではないように思わ:
ImageMagickのに使用されるコマンドを変換するために、
convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg
結果画像:
のOCRたTesseractコマンド:
$ tesseract output.jpg out -psm 7
出力/結果:
テキスト:AUGU - > AUOU
LeptonicaとたTesseractオープンソースのOCRエンジンv4.00.00alpha ページ1
テキスト:VEGU - > VOR-OU
0 Leptonica ページでたTesseractオープンソースのOCRエンジンv4.00.00alpha 1
テキスト:EGUV - > E6UV
Leptonica ページでたTesseractオープンソースのOCRエンジンv4.00.00alpha 1
テキスト: USEA - > USSOEA
文字と数字が回転している可能性があります。私の理解は、OCRは一般的に回転文字が好きではないということです。それは、文字が正しく認識されるように適切な向きになることを期待しています。しかし、私はOCR専門家ではありません。だから、私はもっと知っているかもしれない他の人たちに任せます。 – fmw42
継続:文字が回転していない例を試してください。それは動作しますか? – fmw42
私はtesseractの他のバージョンで作業している、ありがとう! –