0

ペーパー(Times Roman)でテキストを1つの文字だけ認識するようにニューラルネットを訓練したい。 1人のキャラクターにつき1つの訓練サンプルで逃げることはできますか?印刷されたテキストのためにニューラルネットワークを訓練するための簡単なデータセットを作成するOCR

私の理論的根拠は、フォントは手書きのものとは異なり、変化しないということです。私のモデルが訓練された後にそれを推測する前に、私が掃除することができる角度と明るさだけが変わるかもしれません。または私は何かを逃していますか?

答えて

0

入力の場所によって異なります。入力がスクリーンショットになり、フォントが常に同じである(フォントサイズ、太字などを含む)場合、常に同じ色になります。それで、あなたはたぶん1つだけのセットで逃げることができます。

スキャナーや写真からの入力を扱う場合は、部分的に切り取られた文字、ページ内の曲がりや歪んだ3D写真、ページ上の汚れ、その他数百万もの他の文字軽微な違い。あなたはOCRに送る前にそれらをきれいにすることができますが、あなたのクリーナー機能はあなたのOCR機能よりも高度なものでなければならないので、あなたのOCRニューラルネットにたくさんの異なる学習セットを使用するほうが簡単でしょう。

関連する問題