私はTesseractを使用していますが、非テキスト領域とターゲットテキストのみを無視するかどうかはわかりません。より良い出力のために前処理ステップとして非テキスト領域を削除する必要がありますか?Tesseractは、スキャンされた文書の非テキスト領域を無視しますか?
2
A
答えて
2
Tesseractは、テキストを検出するアルゴリズムはかなり優れていますが、最終的には偽陽性の一致が得られます。
理想的には、イメージをtesseractに送信する前に事前処理します。いくつかの時間前、私は同様の作業に従事し、私はあなたが以下の資料を見てみましょうお勧め:
関連する問題
- 1. PDF文書に無制限のテキスト領域を追加する
- 2. UIGestureはすべての透明領域を無視します
- 3. Javascript:テキスト領域のハイライトされた文字列を置き換えますか?
- 4. 接続された領域の領域
- 5. コマンドラインのTesseract OCR制限領域
- 6. スキャンされた文書にテキストを設定する
- 7. UIImageViewから書かれた領域を抽出します
- 8. misd-service-development/phone-number-bundleでデフォルトの領域が無視されます
- 9. ロボットフレームワークのテキスト領域にhtmlテキストを書き込む方法は?
- 10. 上書きされたデータのディスク領域を解放しますか?
- 11. javascriptは空白で保存されたテキスト領域を表示します
- 12. cinは文字を無視しますか? !!!無視されたeof文字の-0の値を返す
- 13. エクスポートされたハイチャート内のテキストのための空き領域
- 14. テキスト領域のキャリッジリターン
- 15. テキスト領域の値が設定されていませんか?
- 16. 変更された領域にテキストを追加するポストコミットフックスクリプト
- 17. SCNScene/SCNSphereの可視領域
- 18. 可視領域の位置
- 19. イメージの非テキスト領域を削除するためのオープンソースコードですか?
- 20. テキスト領域またはmat-form-fildを無効にする方法
- 21. 親Qtの透過領域のMouseArea onClickedイベントを無視してください。
- 22. ネストされた領域Magnolia
- 23. テキスト領域とハイパーリンク?
- 24. 可視領域を追跡するGoogle MapまたはMapquest API
- 25. Chromeは注入されたデバッガ文を無視します
- 26. Firefoxでテキスト領域が無効になっています
- 27. 非表示のラベルの空き領域を無効にする
- 28. 手書きテキストのためのトレーニングtesseract
- 29. jQueryまたはjavascriptでページの可視領域の中心DIV
- 30. ワークシート内の領域/領域をループしますか?