2011-08-12 5 views
3

スキャンした文書ファイル(.tiff ,.)からテキストとテーブルを抽出できる無料のOCR SDKが必要です。 pngなど)を開き、Office Wordドキュメントファイルに保存します。.netのための無料のOCR SDKは、Office Word文書に書式と画像を含むテーブルを抽出することができます。

この問題を解説してください。私はすでにMODIを使用して画像からのみテキストを抽出していますが、MODIを使用してテーブルや画像を抽出してOffice Word文書ファイルに保存する方法を得ることができませんでした。

答えて

3

opensource SDKでタスクを解決できるかどうかはわかりません。あなたが何を記述したかに基づいて、私は、文書論理構造再構成関数を持つ複雑なocrアプリケーションが必要であることがわかります。ビジネスソフトウェアを計画している場合は、ABBYY FineReader Engineをご覧ください。それはdocument analyzing and reconstruction featuresのセットを持っていて、C#用のAPIを提供しています。それは自由に試すことができます。無料のプログラムでは手ごろな価格ではありませんが、ビジネスソフトウェアに関しては、ABBYY OCR技術は製品に深刻な価値を与える可能性がありますので、試してみてください。私は@ ABBYYを働き、必要に応じて追加情報を提供することができます。

お勧めします、Nikolay。