これは、質問がフォローアップのPrepare complex image for OCRです。エッジとフィールドをマージする
私は数字と画像のキャニーエッジ検出器の出力を持っている:あなたが見ることができるように
、私はクレジットカードのエンボスから生じる桁のための様々なエッジを持っています。目標は、文字認識に適した実数の桁を持つことです。
これは、ダイヤモンドの形をした5×5の構造要素との形態学的に近い操作を使用して数字を「埋める」ための試みである:
私は、しかし、多くの成功なしに、様々な構造要素を試してみました。穴がどのように作成されているか(数字9と0)、図形が歪んでいる(数字3)ことがわかります。
構造を塗りつぶすのに適した方法をお勧めしますが、異なる桁を接着したり、元の形状を維持したりする必要はありませんか?
しかし、見栄えの悪い数字であっても、終了操作を適用した後で垂直に数字を分割しても、既に良好な認識結果が得られている。
おかげで、 バレンティン
バレンタイン、私はあなたと同じ問題(OCRでクレジットカードを読む)に取り組んでいます。私は手作業による前処理の後でイメージを読むためにtesseractを使っていくつかの成功を収めましたが、私はまだそのプロセスを自動化することに苦労しています。 あなたは最終的に解決した解決策を知りましたか?あなたのコードはどこからでも入手できますか?私はあなたとノートを比較したいと思います。 – bjmc
私にメールを送ることができます(www.valentin-manthei。あなたが望むならば)。テンプレート/フィーチャマッチング技術と結果を改善するための追加の基準を使用して、独自のアプローチでOCRを実現しました。しかし、前処理は最悪の部分です。パラメータを動的に調整するフィルタチェーン全体が、最終的には良い状況(落雷、分解能)の下でのみ、一部のクレジットカード番号を完全にスキャンすることができます。 – valentin