2017-08-08 20 views
3

複雑な書式のドキュメントからのテキスト認識のために、Google Cloud Application APIをJavaアプリケーションに統合しました。私の同僚の一人が "Tesseract API"を使用するように提案しました。誰でもこの2つのAPIの違いを教えてもらえますか?正確さの面でより優れているか、他の点より優れていますか?Google Cloud Vision OCR APIは、Tesseract OCR APIよりも精度とパフォーマンスが優れています

+0

はいそうです。私は自分の答えを定義するためのソースとリンクがありません。 これは実装が簡単で、オフラインで利用でき、自分の言語を訓練する必要がなく、サイズが小さく、30%正確な結果が得られます。より良い文書と利用可能な例があります。 欠点 モバイルデバイスではまだ言語が制限されており、RTL言語はありません。これは、プレイサービスのバージョンに依存しています。 –

答えて

2

Tesseractはオープンソースです。ローカルで実行できます。 しかし、でも、トレーニングや調整が必要です。一般に、Google、Microsoft、OCR.spaceのクラウドocrサービスよりも認識率が悪いです。しかし、あなたは私たち自身のイメージでこのオンラインを自分でテストする最良の場合:

+0

Googleの商用製品(Google Cloud Vision)はMSよりはるかに優れており、4つの中で最も優れています(Tesseractを含む)。 Tesseractはパフォーマンスと正確さのために底を打っています。 – Jeb50

関連する問題