2017-04-12 10 views
0

Tesseract wikiには、トレーニングで使用するラベル付きtif/boxファイルのファイル名の形式が[lang].[fontname].exp[num]と示されています。 fontnameは実際にトレーニングに影響を与えますか?これはちょうど簿記のためのものですか?Tesseract box/tifファイル名のフォント名は関係しますか?

私のケースでは、フォントが異なる多数のドキュメントイメージがあります(フォントの種類がわかりません)。手動でラベルを付けるドキュメントごとにeng.idontknow.exp[num]を使用することはできますか、何らかの理由でこの混乱を招きますか?前もって感謝します!

答えて

0

実際のフォントと一致するのがベストです(可能なOCR後の分析を支援するため)。ただし、任意のフォント名にすることができます。

関連する問題