知られているレイアウトとフォントでOCRデータを構築する方法

Tesseractを採用しているAndroidアプリでいくつかのeng.traineddataファイルを試したところ、私のアプリケーションはフォント（太字、太字）をいくつか使うだけなので、私自身のデータを構築することで、はるかに高い精度を得ることができたと思います。ユーザーがの写真を撮るになるものの種類（8.5×11インチの紙）の例はここにある：それは調査するための適切なパスであった場合知られているレイアウトとフォントでOCRデータを構築する方法

私はjTessBoxEditorに見えたが、疑問に思っています。もしそうなら、私は出発点に関してどのように進めるか、最初から試してみるかを確信していた。フォント（Times New Romanのように見える）は非常に一般的であり、ホイールを再発明したくありませんでした。私はまた、2つの異なる色の背景にフォントをどのように扱うかについても疑問を抱いていました。

また、Times New RomanフォントでABC ... abc ... 123 ...を印刷してカスタムeng.traineddataファイルにすることができたかどうかは疑問でした。私が正しく理解していれば、あなたのシステムを訓練するために使用されるソース資料に「最もクリーンな」データ（すなわち、文字の「悪い例」がない）が必要です。しかし、特定のフォント用に訓練されたデータを構築する方法について定義されたチュートリアルやプロシージャがあるかのように見えます。もしあれば、それは私を逃れている。

出典

2016-12-17 Dale

私は機械学習の使用を検討しますが、あなた自身で行う必要はありませんので、Tensorflow Mobileをご覧ください。これはモバイルデバイス向けのバージョンで、文字認識に役立つため、これはarticleで見ることができます。

ニューラルネットを訓練するには、正確な出力とともに一連のトレーニングデータを提供する必要があります。この場合、これは128x64 イメージのセットと予想される出力となります。

これは、簡単に文字を認識するためのソリューションを実装するのに役立ちますし、あなただけのより多くの訓練を行うことにより、希望する場合は、このアプローチで行くことによって、あなたはより多くのフォントに拡張することができます。

出典

2016-12-17 23:46:19

知られているレイアウトとフォントでOCRデータを構築する方法

答えて

関連する問題