2011-08-10 1 views
1

私は自分が行っているテキストのみのページ(画像なし)を認識できるようにしたいと思っています。最高のアプローチは何ですか:コンピュータビジョン - テキストのみの本のページを認識するためにイメージマッチングまたはOCRを使用しますか?

私は最初にある種の画像マッチングを考えていましたが、すべてのテキストブックの見た目がとてもよく似ているので、これがどれほどうまくいくのでしょうか?

第2の考えはOCRを使用することでしたか?

ありがとうございます!

+0

これはどのようにクエリされますか?サンプル画像はありますか?理論的には本当に簡単な問題のように聞こえるが、実際には非常に難しいかもしれない。 – carlosdc

+0

はい私は本のページの参照画像を持っています – bainsey

答えて

2

イメージマッチングはあなたのケースでは本当に役に立たないと思います... あなたが現在いるページを検出したい場合、ブックに番号が付いているページがある場合は、TesseractのようなOCRを使用できます。

  • 1)(左上、右、下のページ番号を見つけ..)
  • 2)を抽出し()その上に復号化する
  • (2bis)前処理に進行するimagetを抽出imaget ...)
  • 3)数字は標準的なプリント番号それであれば、あなたは、あなたが胡瞬間を見ることができますOCRを使用したくない場合は

(たTesseractまたは別のOCRを使用して)それをデコードそれらを認識することでかなり良いことがあります。

+0

申し訳ありません私は上に明確ではなかった...助言のおかげですが、私はいくつかの本のためにこれを行うことを目指しているので、書籍間で区別するまた、TesseractのようなOCRが標準的な本のページをどのくらい長くデコードするのか? – bainsey

+0

あなたが必要とするのは、実際に画像処理のアルゴリズムではありません。ちょうどOCRを使用してページ全体を解読し、キーワードを抽出し、ページを照会するとキーワードでデータベースを検索します...非常に簡単ですが、難しく完了しました... – jmartel

+0

ありがとう!私はあなたが正しいと思うし、それを行う唯一の方法ではないなら、それが最高になるでしょう。ページ全体をどのくらい長くデコードすることができますか? – bainsey

関連する問題