2009-04-11 22 views
0

.NETに有能な画像認識ライブラリ(好ましくはオープンソース)があるのだろうか?ページとドキュメントをバッチでスキャンするアプリケーションがあります。ある文書を別の文書と区別するために(私はこれらの文書が複数のページを持つことができるので)、文書の間に別々のページを置くようにユーザーに頼む予定です。したがって、私のアプリケーションはすべてのスキャンを行い、ページが北極熊を含んでいるかどうかをチェックし、そうであれば最初の文書の最後とします。画像認識ライブラリ

私はアプリケーションがテキストを認識するOCRについて知っていますが、画像の中で同等のものは何ですか?

答えて

1

画像認識に関する一般的な質問には答えがありませんが、特定の要件がある場合、より簡単な認識ドメインを置き換える方が簡単ではないかもしれませんか?

具体的に言えば、ユーザーにドキュメント間の配置を依頼するページには、チョコレートのバーコードだけでなく、北極熊(または何でも)のイメージを含めることができます。次に、ポルカバの画像そのものを認識するのではなく、容易に認識できるバーコードを確認することができます。

3

私は正確にあなたがやろうとしているか理解していない確信しているが、あなたはこれらの質問をチェックアウトすることがあります

自分で何かを実装しようとしている場合画像を別の画像のセグメントと比較する。あなたはテンプレートマッチングを使ってそれを行うことができます。 OpenCVも使用できますが、.NET wrapper

0

主に異なるアプリケーションごとに異なる解決策が必要なため、画像認識は困難です。たとえば、白い背景上に単一の黒い記号を識別しようとすると、カラー写真の中の一部の人が重なり、背景に風景がある人物をすべて特定しようとするのとは全く異なる技術が必要になります。使用するためにどのような方法に影響を与えるいくつかの要因は次のようになります。画像の

  • タイプ:記号/文字、日常の写真、医用画像、図形など
  • カラー:黒と白、グレースケール、関心のカラー
  • オブジェクト:顔、人々、図形、記号、一般的なオブジェクト、指紋、虹彩、腫瘍など
  • トレーニング:はあなたがでていますデータの雨が降っていますか?

本当にあなたがしなければならないことは、どのライブラリをどのような方法で試してみるのがよいかを知るために、認識しようとしている画像の種類に関する詳細を教えてください。

+0

私が考えている画像は、ちょうど印刷された画像です。意味私は、ユーザーがコンピュータから北極熊の画像を印刷し、これを文書区切り記号として使用することを計画しています。 – Graviton