私は文書上でOCRを実行するアンドロイドアプリケーションを持っています。 イメージをサーバーに送信する前に、イメージのテストをしたいと思っています。 私はそれがサーバーに送信する前にイメージのフォーカスを測定するためのツール/コードがあれば私の質問です。 サーバー側からの処理時間を節約し、送信しないように、画像にフォーカスがない(シャープではない)かどうかを知りたい。 ありがとうございました デビッドOCRの前に画質を確認してください
答えて
デビッド、それは良い質問です。より多くのフィードバックを収集する際には、皆様の調査結果を共有してください。
私は、この重要な処理ステップを使用し、いくつかの技術を見てきました。実際には、多くの場合可能ではないベッドの画像を検出または修正するよりも、ユーザーに良い画像を撮るのがずっと簡単です。だから検出はいいですが、それは最初のアクションではありません。画像チェックの前にトリガーできるオプションがたくさんあります。以下にそのリストをいくつか示します。過去に私のために働いた、または私が働いていた人々のために働いていたかについて聞いた(技術的および非技術的な)
テクニック:
振れ検出。画像の撮影時に装置の加速度を使って揺れを確認する。良いアプローチですが、主に明るい照明で動作します。暗い環境では、わずかな振動でも、画像は簡単に汚れます。この方法は、他の方法と組み合わせて使用する必要があります。
デバイスのバイナリ化。効率的な伝送のために画像を圧縮し準備するだけでなく、テキストの品質をはっきりと見ることができます。暗い背景を持つカラー画像を見ることは、個々の文字の黒と白のエッジを見ることで、個々の文字の鮮明さについてはっきりとしたものではありません。
プレビュー画面。ユーザーが撮影した写真を見て、送信しようとしていることをユーザーに許可します。画像をプレビューできるアプリがよく表示されますが、ダブルタップするとズームが無効になっています。あなたが実際にテキストを見ることができないので、(たとえそれが悪い場合でも)どんなテキストでも、小さな画面でよく見えます。
私はそれを「強制プレビュー」と呼びます。写真を撮影した後、好ましくは2値化後、自動的に10倍にズームし、鮮明なテキストが表示されているかどうかを確認するようユーザーに依頼する。侵略的なので、ここでは良いデザインが重要ですが、この方法は必要なステップとして作成できるので信頼性があります。
簡単なガイドの手順...良い写真を撮る方法!一部のアプリでは、最初の実行時に一度だけ表示されます。いくつかのアプリは無効にするチャンスを与えます。私のアプリでは、iOS上で自分のアプリFotoNoteをアップデートした後で、これらの指示を提供した後、品質が大幅に向上しました。
- 1. アップロード前の画像のサイズを確認してください
- 2. アップロードする前に画像のサイズ/サイズを確認してください
- 3. httpリクエストの前にアクセストークンを確認してください
- 4. Ruby on Rails - ログイン前にユーザを確認してください
- 5. スウィートシンタックスアンラッピングする前にnilを確認してください
- 6. POSTの名前を確認してください
- 7. 名前のアクセスデータベースを確認してください
- 8. jQuery:送信前に確認してください
- 9. チェックボックスの画像のサイズを確認してください。
- 10. name_suffixを確認してください
- 11. SQL:URLを確認してください
- 12. URLを確認してください
- 13. senderEmailAddressを確認してください
- 14. すべてのJquery Ajaxヒットの前にセッションを確認してください。
- 15. 更新前に外部リンクの状態を確認してください
- 16. 解凍する前にzip/gzipの内容を確認してください
- 17. デバイス:ログインする前に現在のユーザーを確認してください
- 18. 閉じる前にJOptionPaneのデータを確認してください
- 19. Firebaseに挿入する前に重複を確認してください
- 20. 画像の新しいDockerビルドを確認してください
- 21. RPMをインストールする前にLinuxソフトウェアパッケージを確認してください
- 22. 関数を実行する前にclassNameを確認してください
- 23. メールを送信する前に連絡先を確認してください。
- 24. 登録フォームを押す前にユーザー名を確認してください
- 25. BASH:条件をテストする前にエラーを確認してください
- 26. Firebaseアプリケーションの認証ページを確認してください
- 27. preRemoveでエントリーを削除する前に確認してください
- 28. 保存する前に確認ボタンを押してください
- 29. GTK + 3:アプリケーション終了前に確認を依頼してください
- 30. SFTPでファイル転送する前にリモートディレクトリサイズを確認してください
最近、電話機は高速ですが、クライアントでOCRを実行せずに、*結果*を検証用にサーバーに送信してください。 – bdares
https://github.com/rmtheis/tess-two/blob/master/eyes-two/jni/imageutils/blur.cpp – rmtheis