私は自分が行っているテキストのみのページ(画像なし)を認識できるようにしたいと思っています。最高のアプローチは何ですか:コンピュータビジョン - テキストのみの本のページを認識するためにイメージマッチングまたはOCRを使用しますか?
私は最初にある種の画像マッチングを考えていましたが、すべてのテキストブックの見た目がとてもよく似ているので、これがどれほどうまくいくのでしょうか?
第2の考えはOCRを使用することでしたか?
ありがとうございます!
私は自分が行っているテキストのみのページ(画像なし)を認識できるようにしたいと思っています。最高のアプローチは何ですか:コンピュータビジョン - テキストのみの本のページを認識するためにイメージマッチングまたはOCRを使用しますか?
私は最初にある種の画像マッチングを考えていましたが、すべてのテキストブックの見た目がとてもよく似ているので、これがどれほどうまくいくのでしょうか?
第2の考えはOCRを使用することでしたか?
ありがとうございます!
イメージマッチングはあなたのケースでは本当に役に立たないと思います... あなたが現在いるページを検出したい場合、ブックに番号が付いているページがある場合は、TesseractのようなOCRを使用できます。
(たTesseractまたは別のOCRを使用して)それをデコードそれらを認識することでかなり良いことがあります。
申し訳ありません私は上に明確ではなかった...助言のおかげですが、私はいくつかの本のためにこれを行うことを目指しているので、書籍間で区別するまた、TesseractのようなOCRが標準的な本のページをどのくらい長くデコードするのか? – bainsey
あなたが必要とするのは、実際に画像処理のアルゴリズムではありません。ちょうどOCRを使用してページ全体を解読し、キーワードを抽出し、ページを照会するとキーワードでデータベースを検索します...非常に簡単ですが、難しく完了しました... – jmartel
ありがとう!私はあなたが正しいと思うし、それを行う唯一の方法ではないなら、それが最高になるでしょう。ページ全体をどのくらい長くデコードすることができますか? – bainsey
これはどのようにクエリされますか?サンプル画像はありますか?理論的には本当に簡単な問題のように聞こえるが、実際には非常に難しいかもしれない。 – carlosdc
はい私は本のページの参照画像を持っています – bainsey