2012-01-25 9 views
0

ファイルシステム全体、またはテキスト文字列を含むイメージのディレクトリだけを検索できます。もちろん、これはOCR(光学式文字認識)を使用します。イメージ内のテキストのファイルシステムの検索

これはバックグラウンドで実行し、すべての画像のすべてのテキストのインデックスを作成するのが最適です。

私が推論しているのは、テキストを含むスクリーンキャプチャがたくさんあり、それらを検索できるようにしたいと考えています。

既存のソリューションを知っている人はいますか?そうでない場合は、OCRライブラリを使用して自分自身を作成することを考えています。どのようにそれを実装するための任意の提案?

主なターゲットプラットフォームは、Windows 7は、あなたが記述多くのソリューションがあります。もちろん

+0

組み込みのWindows検索やThrid-partyアプリが行う検索を意味しますか? – Tomato

+0

Windowsの組み込み検索では、画像自体にOCRはありません。私は、コンピュータ上のすべてのイメージ、またはディレクトリとそのサブディレクトリにある単語のインデックスを自動的に作成するサードパーティ製のWindowsサービスを探していますので、それらをすばやく検索できます。 – stuckintheshuck

+0

ここでは、テキスト検索のためのWindows Searchのプラグインがあります。http://www.abbyy.com/recognition_server/OCR_IFilter_for_Microsoft/ – Tomato

答えて

1

VietOCRは、新しい入力イメージファイルの監視フォルダを監視し、それらのOCRを実行します。インデックス作成はサポートしていません。このプログラムはオープンソースです。その機能を要件に拡張することができます。

+0

VietOCRはGoogleのTesseract OCRライブラリを使用しているようです。これはそこに一番近いようです。私はそれを使用するインデックスシステムを構築する必要があります。今のところ私は答えとしてこれをマークしています。 – stuckintheshuck

0

です。 まず、「ドキュメント管理システム」と呼ばれる一連の製品があり、コンピュータやネットワーク内のすべてのドキュメントにインデックスを付けることができます。それらの多くはオプションで、OCRおよび画像テキストの索引付け機能を提供します。 第2に、このようなオプションも提供する「エンタープライズ検索システム」のセットがあります(even Google has one)。最終的に、見てat e-discovery termを持っています。これは、米国の法的ニーズに特別に使用される文書管理システムのサブクラスです。

私はこれらの製品が非常に高価なエンタープライズソリューションであると考えています。おそらくどこかにSoHoエディションがあります。私が上記のものをグーグルで試してみてください。

関連する問題