2012-11-29 72 views
6

私は、tesseractからocr桁までを使用してAndroid OCRツールを実装しています。これまでのところ、通常の桁のフォントでは非常に高い精度を与えています。しかし、7桁の数字(LCDに表示される数字)では精度がひどくなります。Android Tesseract OCR 7セグメントの桁

私は0から9までのホワイトリストと、画像処理を無駄にすることを試みました。どのように正確さを高めるためにそこに任意のアイデア?または、tesseractの特定の7桁の数字を訓練するためのヒントがあれば、間違いなく多くの助けになります。

ありがとうございます。

+0

再トレーニングをしなくても良い結果が得られるとは思いません。 7桁の数字のための公に利用可能な訓練されたデータファイルがあればいいですが、私が見たときに私は見つけられませんでした。 – rmtheis

+0

ありがとうございます。私の実装ではブログが本当に助けになりました。あなたに感謝します。私はそれを訓練することを計画しており、ボクシングのプロセスのためのbbtesseractを探しています。公式のものが私にちょっと混乱しているので、誰かがトレーニングプロセスのヒントを分かち合うことができれば、とても感謝しています。 – laurie7

+0

[jTessBoxEditor](http://vietocr.sourceforge.net/training.html)を使用して、トレーニングに使用するTIFF /ボックスファイルを編集または生成できます。トレーニングの残りの部分を自動化するためのPowerShellスクリプト 'train.ps1'もあります。 – nguyenq

答えて

2

あなたはで7つのセグメントのtraineddataを見つけることができます。また、同じリポジトリでのサンプルPythonコードあり

https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital

+0

テッサーの訓練をどのように数字でしか教えていただけませんか? – malaguna

+0

私は "lets go digital"というフォントを使っていくつかの画像を生成し、gimpを使ってノイズを加え、[jTessBoxEditor](http://vietocr.sourceforge.net/training.html)を使ってボックスデータを生成し、[this] (https://github.com/this-is-ari/python-tesseract-3.02-training)トレーニング用のツールです。詳細は[tesseractocr FAQ](https://github.com/tesseract-ocr/tesseract/wiki/FAQ)をご覧ください。私は[トレーニングソース](https://github.com/arturaugusto/display_ocr/tree/master/training_source)も共有しました。 – art

関連する問題