2009-07-03 3 views

答えて

0

私はこれがAdobe Readerソフトウェアの一部であり、API経由ではアクセスできないと考えています。書式仕様ごとにPDFドキュメントを作成するためのAPIとライブラリがありますが、OCRは書式ではなく読者に関係するものです。私はあなたが別のライブラリを使用しなければならないか、それを自分で実装しなければならないかと思います。

+0

確実にサンプル液~/Samples/Tesseract.Samples.slnをチェック!なぜなら私はそれをmakeOCR(ファイル)の形式でのみ必要とするからです。 その後、彼はファイルを開いてOCRを作成します – subprime

+0

@Salvoどんな考えでもacrobat.canを使ってhtmlからpdfに変換することができます。有用なリンクを教えてください.Netアプリケーションで使用する予定です – shreesha

0

.netに適した直接Adobe OCR APIはありません。あなたが達成しようとしているもののために、いくつかの選択肢があります。 GitHubで公開されているGoogleのオープンソースTesseract OCRのオープンソース.Netラッパーは、https://github.com/charlesw/tesseractです。これはあなたにC#のOCR機能を与えるはずです。ドキュメントから

を素早く

  1. をはじめPackage Manager ConsoleからInstall-Package Tesseractを実行することにより、Tesseract NuGetパッケージを追加します。
  2. 「 出力ディレクトリにコピー」を確認してください、あなたは、Visual Studio 2012のx86 & x64のランタイムがtesseract-ocrからたTesseract 3.02のための
  3. ダウンロード言語データファイルをインストールされていることを確認し、プロジェクトに追加しますがAlwaysに設定されています。
  4. 実施例
関連する問題