ocr

    1

    1答えて

    Tesseract for Character Recognitionの代わりになる代替ソフトウェアまたはライブラリがPythonまたはOpenCVにはありますか? Pythonで実装できる文字認識の推奨方法はありますか? おかげ

    2

    1答えて

    手書きをコンピュータ文字に変換するためのニューラルネットワークをKerasに作成します。 私の最初のステップは、文を配列に変換することです。 My Arrayの形状は(1, number of letters,27)です。今度はディープニューラルネットワークに入力してトレーニングしたいと思います。 しかし、寸法が画像の寸法に合わない場合は、どうすれば正しく入力できますか?そして、私の予測関数が私に

    2

    1答えて

    ORCの目次には、\tの後に、そして\nの前に数字がある場合とない場合があります。 入力: 9.1 The Euclidean Group in Two-Dimensional 152 Space E2 CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS, AND SPACE-TIME SYMMETRIES 173 数は二つの文字(こ

    0

    1答えて

    Pythonでpytesseract使用することはできません。 import pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = 'C:\\Python27\\scripts\\pytesseract.exe' im = Image.open('Download.png')

    0

    1答えて

    thisを基にした関数内でこの関数を実行しようとしましたが、xPDFがPDFをPNGに変換できるため、ImageMagick変換ステップと、 pdftopngはルート名を必要とし、この場合は "ocrbook-000001.png"であり、元のPDFのファイル名のPNGを探すときにエラーをスローするので、関数(i)の処理を伴う論理。 私の問題は、TesseractにPNGファイルで何かをさせること

    3

    2答えて

    私は、アプリケーションの画像からテキストを検出するためにGoogleのOCRライブラリを使用しています。以前はうまくいきましたが、突然エラーを出し始めました。私はTextReconigerのインスタンス化中にクラッシュしています。私はサムスンS6のエッジ、サムスンS7などのいくつかのデバイス上でこのクラッシュを取得しており、いくつかのデバイス上で正常に動作しています。 native: pc 000

    0

    2答えて

    任意の文字と数字を含む印刷コードのOCRにOpenCVを使用しています。私のパイプラインでは、スレッショルド、ノイズ除去、グラデーションの形態、そして各文字の周りにバウンディングボックスを配置するために輪郭を見つけることが含まれます。 コードに 'W'が表示されている場合を除いて、非常にうまく動作します。通常、予測が「VAV」または「VV」になるように、2つまたは3つのバウンディングボックスを配置

    1

    1答えて

    現在のテキストキャプチャAPI(GoogleのテキストAPIなど)は、携帯電話のビデオフィードからテキストをキャプチャするのに十分な速度で、テキストとしてカメラに保存されます動く? フレームごとに完全なOCRを実行するのに十分な速さは必要ありません(ただし、これはすばらしいことです)。私はちょうどテキストのブロックを認識し、バウンディングボックスをライブ画像と同期して表示するのに十分な速さを探して

    0

    1答えて

    私は自分のプロジェクトでrmtheis tess-2を使用しています。 多くのチュートリアルを読んだことがありますが、何も助けてくれませんでした。 package com.example.shaur.ocrapp; import android.content.Intent; import android.database.Cursor; import android.graphics.B