0
私はtesseractを使用して画像からテキストを取得しています。私はtesseractを訓練し、画像の正確なフォントである新しい言語を作成し、訓練データには数字だけを含めました。訓練データには、画像内に存在する可能性のあるすべての値も含まれており、具体的には1〜5000であり、同じ値の単語リストも作成されています。しかし、それはまだ1と7だけでなく、時には3と8も混ざります。誰かが、私が別々に再トレーニングするべきか、またはそれをtesseractに与える前に画像上で何らかの処理を行うべきかについての推奨事項はありますか?Tesseractは、正確なフォントのトレーニングにもかかわらず "1"と "7"を混ぜる
問題の理解に役立つようにサンプル画像、tesseractコマンド、および出力を追加するように編集できますか? – thewaywewere