2012-04-17 7 views
2

製品、ライブラリ、またはソリューションの商用またはオープンソース、または以下を支援するアプローチにも気づいている人はいますか?OCR画像からの重要なデータの認識

OCR処理にNuanceのOmnipageを使用しています。それはうまくいく。しかし、私は様々なパターンに基づいていろいろな形のデータを見つけたいと思っています。これは会計のバウチャーになる可能性がありますが、生データのタイプが異種であり、共通の要因がありますが、ルールベースの方法では定義が難しいということです。 いくつかの一般的な要因があります

私は部分的に私の質問に対処して1以前の質問を見つけました(それは、私は私にはない構造化されたPDFのを、持っていたと仮定) *文書の種類が 似ている*がありますキーワードはプレフィックスまたはプレースのいずれかですが、それらのキーワードは同義語を持つ可能性があります *日付のようなデータは国によって異なるフォーマットがあります。例えばDD/MM/YYYY、MM/DD/YYYY、YYYY-MM-DD、DD'th MMM、YYYYなど(私たちはその国を知っていると仮定します) *小数点または小数点の桁で書かれています

答えて

0

私が理解しているように、半構造化フォーム用のデータキャプチャソリューションは基本的に同じデータセットを含んでいますが、レイアウトは文書の出所によって異なる場合があります。銀色の弾丸はなく、ドキュメント上で正しいフィールドを見つける方法と、可能なsynonimでキーワードとは何か、キーワードとデータ自体の幾何学的関係は何かを定義する必要があります。

しかし、このプロセスをはるかに簡単にできる製品があります.C++では、ビジュアルツールでの関係を記述する必要があります。ビジュアルツールでは、そのために特別に設計されています。 。

ABBYY FlexiCapture

この製品は非常に強力で、文書レイアウトdesciptions、そのテストおよびデータ抽出自体の開発をstreamiles。

それのSDKのバージョンもあります:

ABBYY FlexiCapture Engine

は免責事項:このサーバーは、私はABBYY

+0

のために働くのベースされていますか?私はすべての個々のケースを処理する必要はありませんが、同じタイプのドキュメントが頻繁に使用されるため、認識方法をシステムに教えたいと思っています。 –

+0

それは何のためのものなのですか:典型的なレイアウトのためにそれを教え、それらのレイアウトで自動的に動作します。それは完全に魔法ではありません。新しいレイアウトに遭遇した後も、それを技術的に持っていなければなりませんが、それはどうしても避けられないものです。それにサーバ版もあります。 – Tomato

関連する問題