非常に多くの画像ファイルを含むフォルダがあります。場合によっては、スキャンされたドキュメントイメージが偶然にフォルダ内に閉じ込められ、誰かがフォルダを視覚的にスキャンしてしまうと、検出されずに間違った場所に発行されると問題が発生することがあります。画像ファイルの内容を検出する:画像間でスキャンした文書を検索する
いずれの種類のファイルでもスキャンされている可能性があり、サイズは本物の画像の範囲内にあるため、メタデータから検出することは非常に困難です。
誰かが、本物のイメージから、スキャンしたドキュメントをツールやプログラム的な方法で検出する方法を知っていますか?
多くのトレーニングサンプルを使用することで、違いを認識するためにプログラム(アコードなどを使用)を「教える」ことができます。 –
私はこれがおそらく最善の方法だと思います。パターンに合ったように見えるように画像にフラグを立て、人間の見直しに基づいて機械学習がパターンを絶えず洗練することを可能にします。 – BlueChippy