0
OCRアプリケーションでは、通常、画像の接続されたコンポーネントが見つかり、それらを認識するためにOCRエンジンを実行します。OCRシンボルと非シンボル検出/認識
私の質問は、接続されたコンポーネントにトレーニングセットに存在しない記号/図形がある場合はどうすればよいでしょうか。
たとえば、数字認識を実行していて画像に直線または文字がある場合は、「X」とか数字以外の文字を入力します。
数字ではないことをどのように伝えますか?
あなたのOCRライブラリは、近似がどれほど正確であると考えられるかなど、その推測より多くの情報を提供するでしょう。この情報を使用してください。 – Tim
独自の認識エンジンを構築している場合や、少なくともトレーニングを行っている場合は、システムがこの種の決定を正確に行うのを助けるために、多数の「混乱」例を導入することを検討するよりも、 – Predictor