OCRフォームの認識(データ抽出)について、さまざまな記事を見て、フォーム認識を行うためにニューラルネットワークを使用していると言いました。そのため、人工ニューラルネットワーク(ANN)とフォーム認識の関係は何ですか?ビジネスカードからフィールドを抽出する場合は、ANNを使用する必要がありますか、それともオプションですか?言い換えれば、いつANNを使用する必要がありますか?OCRと人工ニューラルネットワークの関係は何ですか?
答えて
少し異なります。 ANNはすべてのOCRの「エキスパート」です。しかし、OCRエンジンには多くの専門家がいます。 ANNを学ぶと、ANNだけを使って簡単なOCRエンジンを構築できますが、これはtri-gram、形態、データ型(BCRとFormsにとって非常に重要です)、辞書、接続コンポーネントアルゴリズムそれで、それを品質の結果を抽出するためのトリックの袋の中のただ一つのツールとして見てください。良いエンジンは、ANNと他のすべてを組み込むでしょう。 BCRでは、追加の考慮事項があり、接続されたコンポーネント、辞書には非常に重いものにし、ANNとパターンマッチングを使用して実際に認識する必要があります。
ANNはOCRを実行する1つの方法です。他にもあります。したがって、ANNを使用してBusinessCardからフィールドを抽出する場合は、オプションです。
良い質問です。私は最近OCRを行うGoogleプロジェクトであるOCRopusで遊んでいました。あなたは無料でそれを入手して、自分で遊ぶことができます。私はそれの背後にあるモジュールの1つとしてANNを持っていると確信しています。しかし、光学式文字認識の全プロセスは、多くのステップ(それぞれが何かを行い、結果を次のモジュールに渡す多数の異なる小さなモジュール)を持つことができます。
だから、ここで私はそのプロジェクト内のモジュールによって行われるものとして覚えているものをいくつか紹介します。黒と白にイメージを回したモジュールがありました
- - これはそれが簡単に後からモジュールになり扱う。
- スペックル/スペックルを除去すること。
- テキストの行を整列させる。個々の単語にテキストの
- 破る行は、ニューラルネットを含まないコードの小さなビットを使用して、上記行うことができ、
基本的には(それがこの1わからない数週間、となっています)。したがって、これらの小さなコードで簡単に処理できます。
私は思ったニューラルネットは、個々の文字を認識するために使用されています - 可能な文字のグループの文字はそれです。
私は1週間以上走っていたOCRopusにトレーニングコマンドがあり、ラインサンプルをマップに送っていて、地図がゆっくりと変化していました。私はそれがANNの部分を訓練していたと思います。
- 1. 人工ニューラルネットワークの深さ
- 2. 複数の人工ニューラルネットワーク
- 3. ディープラーニングと伝統的な人工ニューラルネットワークの学習の違いは何ですか?
- 4. 人工ニューラルネットワークはスポーツゲームの結果を予測できますか?
- 5. 人工ニューラルネットワーク:初期ニューロンの選択
- 6. ニューラルネットワークによる人工生命
- 7. 人工知能のSTRIPSとは何ですか?
- 8. 人工ニューラルネットワークは言語モデルを学習できますか?ペーパー2000の実装
- 9. 人工ニューラルネットワーク(Tic-tac-toe)のコーディング方法は?
- 10. 人工ニューラルネットワークは数学的なセットで動作できますか?
- 11. 自己コード化された2層人工ニューラルネットワークの最適化
- 12. 人工ニューラルネットワークまたは「生物」ニューラルネットワークライブラリ/ソフトウェアを使用していますか?
- 13. ニューラルネットワークのEPOCHとは何ですか?
- 14. 人工ニューラルネットワークを使用した温度予測
- 15. Yii2:関係名とは何ですか?
- 16. 1:何人の関係に参加しますか?
- 17. DAO工場パターンとは何ですか?
- 18. Javascript:工場とは何ですか?
- 19. 人工ニューラルネットワークの結果が偶然ではないことを確認する方法
- 20. phpのclassとcall_user_func()関数の関係は何ですか?
- 21. ターゲット間に人工的な循環依存関係を作成する方法
- 22. EnumとEnumerationの関係は何か
- 23. IS-A関係とHAS-A関係の違いは何ですか? Java
- 24. ブレンドとは? WPFとの関係は何ですか?
- 25. JavaScript/HTML/jQueryとの関係で ".el"とは何ですか?
- 26. 人工知能とエキスパートシステム
- 27. MyISAMテーブルのphpMyAdminでは "内部関係"とは何ですか?
- 28. Angular2/SystemJSでは、systemjs.config.jsと.import()の関係は何ですか?
- 29. 流暢NHibernateと友人の関係
- 30. フラグメント人工バックスタンプ
私は名刺からフィールドを抽出するために使用できる他の方法は何ですか? –
OCRの場合、通常は文字認識のためのモジュール(ANN、SVMなど)を必要とします。まず、ブロック、ライン、カラムを抽出し、正規化、スケール、入力イメージを回転させる必要があります... – alfa
SVMとは何か、それを学ぶ記事はありますか?行、列を抽出し、入力イメージを正規化、拡大縮小、回転させる方法に関する記事 –