ocr

    0

    1答えて

    私のアプリは、このテキストを含むすべての画像を返すためのリスト画像にOCR(modi SharePoint 2017)を使用しています。 それは仕事ですが、アプリのバグは一度に止まります。例:私は32.000の画像を選択し、メソッドを呼び出しました。何時間も動作していましたが、一度に停止していて、理由はわかりません。 アプリケーションは停止する前に8個のエラーを発生させ、エラーが発生したイメージ上

    0

    1答えて

    Tesseract-OCR(python wrapper-tesserocr)を使用してテキストを含むイメージからフォント属性を抽出する次のコードがあります。 for image in image_list: print "Starting for ",image font_attribute_list = [] with PyTessBaseAPI(oem=0) a

    0

    1答えて

    OCR用GoogleのCloud Vision APIを使用します。 Pythonのサンプルコードhereを使用して、我々が持っている:私は私のAPIキーを入れてください def detect_text(path): """Detects text in the file.""" client = vision.ImageAnnotatorClient() with io.open(pat

    0

    2答えて

    この画像には、30ブロックのユーザーデータが含まれています。私はこれらの30ブロックをPNGファイルとして抽出し、tesseract-ocrを実行してそれらからテキストを抽出する予定です。誰かが30個のPNGファイルを取得するためにimagemagickを使う方法を教えてもらえますか?

    0

    1答えて

    OCRプロセスの準備を整えるために、画像の背景ノイズを除去したいと考えています。 今私はImageMagickのツールの-latパラメータと遊ぶ: magick.exe image_02_RESIZED.jpg -lat 20x20+10% test.jpg が、それは完全に画像から背景を削除します。 これは、言及したコマンドの出力例を示します。これに代えて - 私はその上に黒のテキストと白い

    0

    1答えて

    私はオンラインライブラリを使用しており、場所から画像の単語を取得できます。 ここでは、画像にあるような文章を作成したいと考えています。 どうすればいいですか? 以前の私は2つの単語間の距離を使用し、非常に近いがある場合、それはそれは文の一部であることを意味しますが、このアプローチは、これは私が私を受け付けておりますJSONで 助けてください罰金 が動作していません"ワード1"、 "左":106、

    -1

    2答えて

    私はpdfファイルとして入力を受け入れる製品を開発中です。私たちは第三者のAPIを通してpdfの内容を読んでいます。 pdfがスキャンされたファイルまたはコピー制限がある場合、これらのAPIは失敗します。これらの詳細を出力しないAPI。 C#で検索する方法はありますか?PDFが通常のファイルでスキャンされているかどうかを検出できますか?だから、私はユーザーに適切なメッセージを表示することができます

    -1

    1答えて

    私は手で記入されている事前定義されたフォームからのデータ入力を自動化するために探しています。文字は区切られていませんが、フィールドは表の下または表の一部として識別できます。手書きのOCRは依然として活発な研究の領域であり、私はオペレータレビュー機能を含めることができるので、90%を超える確度は期待していません。 私が考えた最初の解決策は、フィールド識別用のOpenCV(http://answers