2011-09-24 12 views
14

私はコンピュータビジョンの初心者ですが、私はopencvでいくつかの関数を使う方法を知っています。私はOpencv for Document Recognitionを使用しようとしています。そのための手順を見つけるためのヘルプが必要です。OCRでのOpencvによる文書認識の使い方

opencvの例find_obj.cppを使用することを考えていますが、パスポートなどのドキュメントには変数、名前、生年月日、画像があります。だから、私はそれのためのステップを定義するための助けが必要であり、可能であればどのように機能をステップで使用しなければならないのかが分かります。

私はコード全体を尋ねることはしませんが、誰かが例のリンクを持っているか、ウォークスルーを入力するだけで大​​いに役立ちます。

答えて

24

2つの非常に異なるステップがあります。 1つはあなたのオブジェクトを検出し、もう1つはそれを分析しています。

オブジェクトの検出では、オブジェクトがフレーム内にあるかどうか、およそそのオブジェクトが存在する場所を把握しようとしています。 OpenCvの機能フレームワークはこれに最適です。いくつかのチュートリアルと包括的なサンプルコードについては、OpenCv features2dチュートリアル、特にfeature matching tutorialを参照してください。

解析には、光学式文字認識(OCR)を掘り下げる必要があります。 OpenCvにはOCRライブラリは含まれていませんが、偉大なOCRライブラリであるtesseract-ocrをチェックアウトすることをお勧めします。ドキュメントに固定構造(テキストフィールドの一貫したレイアウト)がある場合は、tesseract-ocrだけが必要です。より高度な分析のために、ocropusは、tesseract-ocrを使用しますが、レイアウト解析を追加します。

+0

私はこのソリューションを試していますが、実際の例では成功していない場合、テンプレート計算では同じ解像度の画像しか使わないといけないと思います。か否か? – Ricardo

+1

実際の例に問題がある場合は、使用している特定のフォントに対してtesseract-ocrを習得する必要があります。それ以外の場合は、デフォルトのデータベースを使用しているため、作業しているテキストと一致しない可能性があります。あなたはtesseract-ocrにフィードする前にテキストの拡大縮小を試みるかもしれません。高さは20pxくらいありました。 –

+0

tesseractのトレーニング方法に関するリンクがありますか?私は良い結果を得るのに苦労しているし、訓練の仕方に関するわかりやすいチュートリアルが見つかりません – Tjorriemorrie

関連する問題