OCRの作業に取り掛かっていますが、OCR結果をフィルタリングして各文字列をテキストフィールドのセットに移動する方法にはまだまだ取り組んでいません。例についてはOCRの結果をフィルタリングする
、 OCR結果:
名:JHON
番号:12345
住所:カナダ
...しかし、時にはそれが "JHON" を割り当て、テキストフィールド「アドレス」に、「Jhon」をテキストフィールド「いいえ」に設定します。
OCRの作業に取り掛かっていますが、OCR結果をフィルタリングして各文字列をテキストフィールドのセットに移動する方法にはまだまだ取り組んでいません。例についてはOCRの結果をフィルタリングする
、 OCR結果:
名:JHON
番号:12345
住所:カナダ
...しかし、時にはそれが "JHON" を割り当て、テキストフィールド「アドレス」に、「Jhon」をテキストフィールド「いいえ」に設定します。
チェックサムが組み込まれているデータ(通常は銀行口座番号)の場合、チェックサムを検証できます。誤検出が非常に少ない場合は、ビデオストリーム入力が必要です。いくつかの結果を蓄積する。ほとんどのチェックサム有効なものが同じであれば、それは正しい文字列(99,5 +%)になります。
ビデオストリームと累積結果がなければ、チェックサムデータで97〜99,5%になる可能性があります。
チェックサムなし:まあ、あなたは本当に分かりません。
「いいえ」のようなフィールドの場合は、少なくともアルファベット順の結果を拒否することができます。「名前」は数字を罰することができます(名前の桁が有効ではない曖昧な国がいくつかあります)。 "alphabet_digit"の結果にボーナスの信頼感を与え、すべての街頭/都市の文字列の辞書を持っているが、最終的にどの結果が他のものよりも正しいかどうかは分かりません。
もう一度ビデオストリームを入力し、より長い期間(1〜5秒)にわたって複数の結果を蓄積すると、いくつかの統計を実行するのに十分な結果が得られます。 OCRは、それが「正しい」と考える。
でも、このような文字列の信頼性は、ヒント(数字/文字/サイズ/位置)のない一般的なテキストの場合、おそらく98%未満、90-95% range(文字列全体としては、OCR自体が1文字あたり約95〜98%です)。