Google Vision OCR APIは数式を読み取ることができません。複雑な数式を読むために訓練できますか?はいの場合は、手順をお知らせください。そうでない場合は、その目的に役立つ他のOCRを提案してください。私たちはそれらをAPIとして必要とし、我々のアプリケーションと統合することができます。Google視覚OCRを印刷して、複雑な数式を印刷できますか?
ありがとうございました。
Google Vision OCR APIは数式を読み取ることができません。複雑な数式を読むために訓練できますか?はいの場合は、手順をお知らせください。そうでない場合は、その目的に役立つ他のOCRを提案してください。私たちはそれらをAPIとして必要とし、我々のアプリケーションと統合することができます。Google視覚OCRを印刷して、複雑な数式を印刷できますか?
ありがとうございました。
GoogleのOCR APIは訓練できません。もっと正確に言えば、Googleチームのみが訓練することができます。 OCR言語のようないくつかの設定以外の認識機能をカスタマイズするオプションはありません。これはMicrosoft Cognitive Services APIまたは一般的な無料のOCR.space OCR APIでも同じです。認識自体は、ユーザー視点から常に「ハードコード」されています。
訓練可能なOCRシステムがTesseractまたはTensorflowで構築することができ、ここで、例えば:https://matthewearl.github.io/2016/05/06/cnn-anpr/
数学的表現は、算術から微分・積分方程式に何を意味するかもしれません。あなたがNNにそれらを読むように訓練することができたら、あなたは次に何をしますか?それは広すぎます。私はあなたの要件を狭めるでしょう。 – duffymo