2017-05-25 8 views
1

現在、私はTesseract v3.02に英国の運転免許証を認識させるよう教えています。私はQT Box Editorを使って.boxファイルを生成していますので、これらの文書のフォントとレイアウトを認識するためにtesseractを "訓練"することができます。それで私のために質問が浮上しました:それぞれの手紙を密接に作っていますか、それともそれを与える方が良いでしょうか。一杯のパディングは一周ですか?Tesseract OCRラーニングボックスを切り抜かなければならないか

答えて

0

答えは「エンジンがテキストを最もよく認識するように見えるもの」です。あなたがあなたの* .traineddataファイルをコンパイルしてテストしたら、あなたは知っているでしょう。

+0

私はウェブサイトのウェブカメラから米国の運転免許証で同じことをしています。私はコマンドラインバージョンを使用することを計画しているので、私は自分のサイトから呼び出すことができますが、APIを使用することになります。どちらの場合でも、名前、住所、およびDOBのライセンスをどこで調べるべきかについてtesseractを訓練できますが、それを読むためにグラフィカルインターフェイスを使用しないでください。基本的には、まだコマンドラインでイメージを読んでいますが、どこに見えるように教えていますか? – Tanoshimi

+0

私は分かりません。あなたはおそらく開発者にそれを尋ねなければならないでしょう。私は見つけた各単語のピクセル座標を実際に伝える別の(プレミアム)パッケージを使用してしまいました。そしてそれから、私は定義されたテンプレートを使って、その言葉の意味を理解することができます。実際にはそれはどこに単語があるのか​​をMEに伝えます。ID番号の範囲内に入るとID番号になります。 –

関連する問題