私は自分のlinux環境にtesseractをインストールしました。tesseractは小さなラベルを手に入れませんでした
私は
# tesseract myPic.jpg /output
のようなものを実行するとき、それは動作しますが、私のPICは、いくつかの小さなラベルやたTesseractがそれらを見ていない持っています。
オプションでピッチなどを設定できますか?テキストラベルの
例:
:
は、たTesseractは、しかし、この写真と...
を任意の値を認識しません。私は次の出力を持っています:
J8
J7A-J7B P7 \
2
40 50 0 180 190
200
P1 P2 7
110 110
\ l
たとえば、この場合には、(左上の)90がたTesseractで見られない...
私はそれだけで定義する、あるいは全く、そのようsomethinkするためのオプションだと思いますか?
Thxを
たTesseract(ならびに任意のOCRエンジン)からの正確な結果を得るために
Thxをは、なぜそれができませんたとえば、2番目の画像の左上にある90のすべてのラベルを認識すると、読みやすくなりそうです – Paul
エンジンを訓練して、より良い結果を得るか、より良い開始画像を使用して、ピクセルを補間してサイズを変更します。 – hcham1
私の場合に使用する最適なセグメンテーション方法は何ですか? – Paul