Tesseract(OCRライブラリ)を使用してiOSアプリケーションを作成しています(通常のフォントを使用しています)。7セグメント表示OCR
私が抱えている問題は、7セグメントディスプレイで試してみると非常に悪い結果になることです。
だから私の質問です:どのように私はこの問題に近づくことができます知っていますか? Tesseractがこれらの文字を認識する方法はありますか?
Tesseract(OCRライブラリ)を使用してiOSアプリケーションを作成しています(通常のフォントを使用しています)。7セグメント表示OCR
私が抱えている問題は、7セグメントディスプレイで試してみると非常に悪い結果になることです。
だから私の質問です:どのように私はこの問題に近づくことができます知っていますか? Tesseractがこれらの文字を認識する方法はありますか?
私は、LCDディスプレイの画像から数字を認識するために、tesseractを取得することも非常に困難でした。
Iは、セグメント間のギャップを埋めるためにわずかな垂直シフトで自身の画像のコピーをオーバーレイするのImageMagickで画像を前処理することによって、いくつかのわずかな成功を収めて:最後に
$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png
このコードの著者、エリックAuerswald、へhttp://www.unix-ag.uni-kl.de/~auerswal/ssocr/
多くの感謝:、しかし、私の救いは、バイナリ「7セグメント光学文字認識は」でした!
iOSでssocrを実行するには? – phnmnn
どのようにアンドロイドで使用しましたか? –
OCRing 7セグメント表示は試していませんが、接続されていない文字が原因で問題が発生している可能性があります。 Tesseractは私の経験から切断されたフォントをうまく扱いません。
シンプルな侵食(画像前処理)はセグメントを接続することで役立ちますが、ひずみが大きくなりすぎないように、テストしてカーネルサイズで再生する必要があります。
そうです。私はちょうど写真(接続された数字で)上でOCRを試してみるために、自分でピクセルを着色しようとしましたが、それでも動作しませんでした。おそらく、フォントが奇妙なので、私はフォントを処理しようとしています。あなたの答えのためのThx: – Karim
その後、そのフォントを使ってtesseractを鍛えます。セグメントを連結した後にフォントを使用するほうが良いかもしれませんが、どちらが良いかを見るためには両方を試してみることをお勧めします。 –
面白いのは、この特定のパッケージに関係なく、7セグメント文字(簡単な画像処理 - エッジ検出)を識別し、長さと方向を見つけることで半分になることがはるかに簡単です – Ofir