私が認識していることを解決しようとしているのは、その専門知識が不足しています。 3行5列のテーブルのイメージがあるとします。各行にはテキスト(今は英語のみ)または数字(通常のインドアラビア数字)が含まれています。列の間と各行の間に空白だけがあります。今、すべての行とすべての列が整列していると仮定して、私の仕事は、文書から各行を認識して抽出するアルゴリズムを取得することです(これを十分に明示しているかどうかはわかりません)。コンピュータビジョンアプリケーションを使用して、イメージ内のテーブルを空白で行に分割します。
誰かが良い出発点(ライブラリ、似たような例、このようなものを扱うテキストブックの章)などを提案することができますか?
私の背景はデータ科学ですが、私はコンピュータビジョンに曝されたことはありません。
ご協力いただければ幸いです。
open cv:http://opencv.org/をご覧ください – Keatinge