2011-01-07 7 views
2

私は、私が識別できるイメージファイルのセットを持っています。 OCRではなく、セット内の一致のみを検索したいと考えています。マッチをすばやく見つけるのに理想的なプラットフォームは何ですか?カスタム文字の画像を確認する方法は?

答えて

3

OpenCVは、高度なコンピュータビジョンライブラリです。それはテキストブロック、色、形などを認識することができますので、使用するかもしれません。

Tesseractは、言語を処理するために訓練することはできますが、私はあなたが形でそれを訓練できなかった理由を見ることができません。ここには本当に混乱しているがあります。

ImageMagickも有用です。それはかなりハードコア無限のパラメータ連鎖ですが、あなたはそれを取得して画像を見つけることができます。このアプリケーションには完璧ではありませんが、これまでに行われています。ドキュメントはと非常に豪華ですですが、私が望むように完全な図解です(CLIを使用した迅速なイメージ操作には便利なので、頻繁に使用しています)。ここにはimage comparison documentationがあります。

私はOpenCVを提案しますが、それはあなた次第です。がんばろう!

+0

私はOCRに私が持っている文字セットを認識させるように訓練しているかもしれませんが、問題はその文字セットに含まれていないものも除外したいということです。 – user474632

+1

私はImageMagickを見て、それを行うことができます。別のイメージ内のイメージを検索し、座標を返すことができます。 – Blender

+1

Tesseractはあなたのセットに含まれていないものをすべて除外します。ロシア語と英語を混在させることはありません。 1回の実行につき1回だけ実行します。 – Blender