2017-04-19 3 views
0

Tesseractボックスファイルのトレーニング中に、いくつかのボックスを移動するためのスクリプトを書く必要があることがわかりました。どの列がX/Y/W/Hに対応するかを判断するためにボックスファイルを開き、5番目の列を発見しました。 Tesseract wikiは何の説明もしていません。そして、 "Make Box Files"セクションに与えられた例は、5列目にゼロしか含まれていません。私の訓練されたファイルには他の記号が含まれ例えば、これらは私が見つけたシンボルの一部です:[":、}" * * < & \; \ |]これらの意味は?tesseractのボックスファイルの第5列の意味は何ですか?

答えて

1

ページ番号を表します(Training wiki参照)。ボックスファイルが正しく生成されなかったようです。

+0

そうです、私は文字列を無視していました。私は実際にあなたのjTessBoxEditorを使用しています(ところで、すべての便利なツールとコメントをオンラインでありがとう!)。 – MrMulliner

1

正しく覚えていれば、5番目の列はホワイトリスト別のテキストのためである間、文字の。そうすれば、あなたは、一方の領域のため、数字のみを指定することができます。

たTesseractは、所定の領域のためのホワイトリストからシンボルのみを認識します。あなたはおそらく6又は最後の列を意味

+0

だから違うシンボルはなぜですか? – MrMulliner