Tesseract OCRラーニングボックスを切り抜かなければならないか

現在、私はTesseract v3.02に英国の運転免許証を認識させるよう教えています。私はQT Box Editorを使って.boxファイルを生成していますので、これらの文書のフォントとレイアウトを認識するためにtesseractを "訓練"することができます。それで私のために質問が浮上しました：それぞれの手紙を密接に作っていますか、それともそれを与える方が良いでしょうか。一杯のパディングは一周ですか？Tesseract OCRラーニングボックスを切り抜かなければならないか

出典

2017-05-25 Captain Kenpachi

答えは「エンジンがテキストを最もよく認識するように見えるもの」です。あなたがあなたの* .traineddataファイルをコンパイルしてテストしたら、あなたは知っているでしょう。

出典

2017-05-26 08:45:43

私はウェブサイトのウェブカメラから米国の運転免許証で同じことをしています。私はコマンドラインバージョンを使用することを計画しているので、私は自分のサイトから呼び出すことができますが、APIを使用することになります。どちらの場合でも、名前、住所、およびDOBのライセンスをどこで調べるべきかについてtesseractを訓練できますが、それを読むためにグラフィカルインターフェイスを使用しないでください。基本的には、まだコマンドラインでイメージを読んでいますが、どこに見えるように教えていますか？ – Tanoshimi

私は分かりません。あなたはおそらく開発者にそれを尋ねなければならないでしょう。私は見つけた各単語のピクセル座標を実際に伝える別の（プレミアム）パッケージを使用してしまいました。そしてそれから、私は定義されたテンプレートを使って、その言葉の意味を理解することができます。実際にはそれはどこに単語があるのかをMEに伝えます。ID番号の範囲内に入るとID番号になります。 –

Tesseract OCRラーニングボックスを切り抜かなければならないか

答えて

関連する問題