2011-02-06 4 views
0

OCRアプリケーションでは、通常、画像の接続されたコンポーネントが見つかり、それらを認識するためにOCRエンジンを実行します。OCRシンボルと非シンボル検出/認識

私の質問は、接続されたコンポーネントにトレーニングセットに存在しない記号/図形がある場合はどうすればよいでしょうか。

たとえば、数字認識を実行していて画像に直線または文字がある場合は、「X」とか数字以外の文字を入力します。

数字ではないことをどのように伝えますか?

+1

あなたのOCRライブラリは、近似がどれほど正確であると考えられるかなど、その推測より多くの情報を提供するでしょう。この情報を使用してください。 – Tim

+0

独自の認識エンジンを構築している場合や、少なくともトレーニングを行っている場合は、システムがこの種の決定を正確に行うのを助けるために、多数の「混乱」例を導入することを検討するよりも、 – Predictor

答えて

1

通常、OCRエンジンは、認識された各シンボルの信頼スコアを提供します。この信頼スコアに許容しきい値を設定すると、数字と数字以外の情報を区別できます。 幸運

関連する問題