コンピュータビジョン - テキストのみの本のページを認識するためにイメージマッチングまたはOCRを使用しますか？

私は自分が行っているテキストのみのページ（画像なし）を認識できるようにしたいと思っています。最高のアプローチは何ですか：コンピュータビジョン - テキストのみの本のページを認識するためにイメージマッチングまたはOCRを使用しますか？

私は最初にある種の画像マッチングを考えていましたが、すべてのテキストブックの見た目がとてもよく似ているので、これがどれほどうまくいくのでしょうか？

第2の考えはOCRを使用することでしたか？

ありがとうございます！

2011-08-10 bainsey

これはどのようにクエリされますか？サンプル画像はありますか？理論的には本当に簡単な問題のように聞こえるが、実際には非常に難しいかもしれない。 – carlosdc

はい私は本のページの参照画像を持っています – bainsey

イメージマッチングはあなたのケースでは本当に役に立たないと思います... あなたが現在いるページを検出したい場合、ブックに番号が付いているページがある場合は、TesseractのようなOCRを使用できます。

（たTesseractまたは別のOCRを使用して）それをデコードそれらを認識することでかなり良いことがあります。

2011-08-11 06:06:34 jmartel

申し訳ありません私は上に明確ではなかった...助言のおかげですが、私はいくつかの本のためにこれを行うことを目指しているので、書籍間で区別するまた、TesseractのようなOCRが標準的な本のページをどのくらい長くデコードするのか？ – bainsey

あなたが必要とするのは、実際に画像処理のアルゴリズムではありません。ちょうどOCRを使用してページ全体を解読し、キーワードを抽出し、ページを照会するとキーワードでデータベースを検索します...非常に簡単ですが、難しく完了しました... – jmartel

ありがとう！私はあなたが正しいと思うし、それを行う唯一の方法ではないなら、それが最高になるでしょう。ページ全体をどのくらい長くデコードすることができますか？ – bainsey

答えて