ocr

0熱

1答えて

私のアプリは、このテキストを含むすべての画像を返すためのリスト画像にOCR（modi SharePoint 2017）を使用しています。それは仕事ですが、アプリのバグは一度に止まります。例：私は32.000の画像を選択し、メソッドを呼び出しました。何時間も動作していましたが、一度に停止していて、理由はわかりません。アプリケーションは停止する前に8個のエラーを発生させ、エラーが発生したイメージ上

0熱

1答えて

イメージからフィーチャーを抽出するためのPythonループが完全に実行されない

Tesseract-OCR（python wrapper-tesserocr）を使用してテキストを含むイメージからフォント属性を抽出する次のコードがあります。 for image in image_list: print "Starting for ",image font_attribute_list = [] with PyTessBaseAPI(oem=0) a

0熱

1答えて

Google Cloud Vision APIではAPIキーはどこにありますか？

OCR用GoogleのCloud Vision APIを使用します。 Pythonのサンプルコードhereを使用して、我々が持っている：私は私のAPIキーを入れてください def detect_text(path): """Detects text in the file.""" client = vision.ImageAnnotatorClient() with io.open(pat

0熱

2答えて

Ubuntuの複数の画像にPNGを埋め込んで画像を作成

この画像には、30ブロックのユーザーデータが含まれています。私はこれらの30ブロックをPNGファイルとして抽出し、tesseract-ocrを実行してそれらからテキストを抽出する予定です。誰かが30個のPNGファイルを取得するためにimagemagickを使う方法を教えてもらえますか？

0熱

1答えて

ImageMagickはバックグラウンドノイズを除去して白色にします

OCRプロセスの準備を整えるために、画像の背景ノイズを除去したいと考えています。今私はImageMagickのツールの-latパラメータと遊ぶ： magick.exe image_02_RESIZED.jpg -lat 20x20+10% test.jpg が、それは完全に画像から背景を削除します。これは、言及したコマンドの出力例を示します。これに代えて - 私はその上に黒のテキストと白い

0熱

1答えて

画像からその場所のテキストを取り出すことができます...どのようにして文章を作成できますか？

私はオンラインライブラリを使用しており、場所から画像の単語を取得できます。ここでは、画像にあるような文章を作成したいと考えています。どうすればいいですか？以前の私は2つの単語間の距離を使用し、非常に近いがある場合、それはそれは文の一部であることを意味しますが、このアプローチは、これは私が私を受け付けておりますJSONで助けてください罰金が動作していません"ワード1"、 "左"：106、

-1熱

2答えて

pdfがツールでスキャンまたは生成されたかどうかを検出する方法

私はpdfファイルとして入力を受け入れる製品を開発中です。私たちは第三者のAPIを通してpdfの内容を読んでいます。 pdfがスキャンされたファイルまたはコピー制限がある場合、これらのAPIは失敗します。これらの詳細を出力しないAPI。 C＃で検索する方法はありますか？PDFが通常のファイルでスキャンされているかどうかを検出できますか？だから、私はユーザーに適切なメッセージを表示することができます

-1熱

1答えて

データ入力の自動化

私は手で記入されている事前定義されたフォームからのデータ入力を自動化するために探しています。文字は区切られていませんが、フィールドは表の下または表の一部として識別できます。手書きのOCRは依然として活発な研究の領域であり、私はオペレータレビュー機能を含めることができるので、90％を超える確度は期待していません。私が考えた最初の解決策は、フィールド識別用のOpenCV（http://answers