2016-05-04 1 views
0

私が認識していることを解決しようとしているのは、その専門知識が不足しています。 3行5列のテーブルのイメージがあるとします。各行にはテキスト(今は英語のみ)または数字(通常のインドアラビア数字)が含まれています。列の間と各行の間に空白だけがあります。今、すべての行とすべての列が整列していると仮定して、私の仕事は、文書から各行を認識して抽出するアルゴリズムを取得することです(これを十分に明示しているかどうかはわかりません)。コンピュータビジョンアプリケーションを使用して、イメージ内のテーブルを空白で行に分割します。

誰かが良い出発点(ライブラリ、似たような例、このようなものを扱うテキストブックの章)などを提案することができますか?

私の背景はデータ科学ですが、私はコンピュータビジョンに曝されたことはありません。

ご協力いただければ幸いです。

+1

open cv:http://opencv.org/をご覧ください – Keatinge

答えて

0

あなたは、Racialzが提案したように、OpenCVで始める必要があります。このツールには、ハフライン/ハフ変換メソッドが含まれています。このメソッドは、テーブルセクションからテキストを見つけて切り抜くための最も簡単で簡単な方法です。この寓意(例えばTHISTHISなど)を使用する行の検索にはさまざまなタスクがありますが、これらの例ではなく、はるかに明確で単純なものにする必要があります。抽出した後、テキストをスキャンする必要があります。このためには、tesseract ocr engineを使用することをお勧めします。このエンジンは無料で、本当に使いやすく、かなり良い結果を提供し、特定の種類の文字をスキャンするようにトレーニングすることができます。

関連する問題