私は文字認識が必要なプロジェクトに取り組んでいます。私はIAMの手書きデータセットを使用していますので、すべての画像は同じ条件で多かれ少なかれ撮影されています。私はたTesseractフィギュアまかせ抽出した文字 Tesseract OCRは文字を認識しません
- 2値化し、しきい値
- 次のデータセットによって提供されている単語の絵を使用していますどのような英語のアルファベットである
私が達成しようとしているのは、人の文書の文字をアルファベットで分類されたフォルダに保存し、後でそれらからテンプレートを形成する。このために私はそれがどの文字かを知る必要があります。
は、ここで私は、結果として得られるものだ -
すべての文字が適切に(ほとんどの場合)、セグメント化されています。これはPythonの質問よりももっとtesseractの質問ですが、私はpythonを使ってスクリプトを書いて、pyessessactラッパーを通してtesseractを呼び出しています。
私は画像を操作するためにOpenCVを使用しています。これらの文字行列の画像は、tesseractへの入力として送信されます(pytesseractによって処理されます)。入力は問題ではない、私はあなたを保証します。テセラクトが働くために必要なことは他にありますか?
これらの文字は認識されません。
どのようなtesseractバージョンを使用していますか?あなたはcmdやコードから使用していますか?パラメータとは何ですか? –
Tesseractに渡す文字の高さは何ピクセルですか? –
@DmitriiZ。バージョン4.0。そして、ええ、私はコードから使用しています。コードはコマンド 'tesseract input output'を呼び出し、出力を返します。 – Zeokav