OCR画像からの重要なデータの認識

製品、ライブラリ、またはソリューションの商用またはオープンソース、または以下を支援するアプローチにも気づいている人はいますか？OCR画像からの重要なデータの認識

OCR処理にNuanceのOmnipageを使用しています。それはうまくいく。しかし、私は様々なパターンに基づいていろいろな形のデータを見つけたいと思っています。これは会計のバウチャーになる可能性がありますが、生データのタイプが異種であり、共通の要因がありますが、ルールベースの方法では定義が難しいということです。いくつかの一般的な要因があります

私は部分的に私の質問に対処して1以前の質問を見つけました（それは、私は私にはない構造化されたPDFのを、持っていたと仮定） *文書の種類が似ている*がありますキーワードはプレフィックスまたはプレースのいずれかですが、それらのキーワードは同義語を持つ可能性があります *日付のようなデータは国によって異なるフォーマットがあります。例えばDD/MM/YYYY、MM/DD/YYYY、YYYY-MM-DD、DD'th MMM、YYYYなど（私たちはその国を知っていると仮定します） *小数点または小数点の桁で書かれています

出典

2012-04-17 Mikael Gislen

私が理解しているように、半構造化フォーム用のデータキャプチャソリューションは基本的に同じデータセットを含んでいますが、レイアウトは文書の出所によって異なる場合があります。銀色の弾丸はなく、ドキュメント上で正しいフィールドを見つける方法と、可能なsynonimでキーワードとは何か、キーワードとデータ自体の幾何学的関係は何かを定義する必要があります。

しかし、このプロセスをはるかに簡単にできる製品があります.C++では、ビジュアルツールでの関係を記述する必要があります。ビジュアルツールでは、そのために特別に設計されています。。

ABBYY FlexiCapture

この製品は非常に強力で、文書レイアウトdesciptions、そのテストおよびデータ抽出自体の開発をstreamiles。

それのSDKのバージョンもあります：

ABBYY FlexiCapture Engine

は免責事項：このサーバーは、私はABBYY

出典

2012-04-19 13:18:12 Tomato

のために働くのベースされていますか？私はすべての個々のケースを処理する必要はありませんが、同じタイプのドキュメントが頻繁に使用されるため、認識方法をシステムに教えたいと思っています。 –

それは何のためのものなのですか：典型的なレイアウトのためにそれを教え、それらのレイアウトで自動的に動作します。それは完全に魔法ではありません。新しいレイアウトに遭遇した後も、それを技術的に持っていなければなりませんが、それはどうしても避けられないものです。それにサーバ版もあります。 – Tomato

OCR画像からの重要なデータの認識

答えて

関連する問題