テキストから太字のテキストを取得するのには苦労しています。私はここに画像を添付しました。 太字のテキストでOCRを行うTesseract
私はOpenCVのを使用して画像の色を反転し、私はたTesseractは、テキスト出力として5を与えたいと思うが、私は空の値を取得
にそれを変更しました。
複数行のテキストを含む画像。この画像データは、両方の画像がpsm
7
に設定8
、又は9
と認識することができるPSM 7,8または9
テキストから太字のテキストを取得するのには苦労しています。私はここに画像を添付しました。 太字のテキストでOCRを行うTesseract
私はOpenCVのを使用して画像の色を反転し、私はたTesseractは、テキスト出力として5を与えたいと思うが、私は空の値を取得
にそれを変更しました。
複数行のテキストを含む画像。この画像データは、両方の画像がpsm
7
に設定8
、又は9
と認識することができるPSM 7,8または9
を用いて抽出されていません。 3.x.xを使用している場合は、Tesseract 4.0.0 alphaを使用してOCR結果を改善することを提案し、--psm 9
を使用してください。
Page segmentation mode:
7 Treat the image as a single text line.
8 Treat the image as a single word.
9 Treat the image as a single word in a circle.
このヘルプが必要です。
EDIT:
使用するPSM識別するために、オンザフライであなたの追加質問については、あなたが使用することをpsm
値を決定するために、画像の高さを確認することがあります。
たとえば、5
の高さは80で、fox
メッセージは480です。ピクセル値では、psm
の値を設定するコードを実装する方が簡単です。
ありがとう、これは役に立ちます:) 私は複数の画像でOCRをやっています。他のイメージの場合は、複数の行にテキストがある場合、どのイメージをどのpsmで使用するのかをどうやって特定するのですか? – kant01
@ kant01投稿を編集して、複数の行の画像サンプルを含めることはできますか? – thewaywewere
@ kant01あなたのEDITを見ただけです(あなたが@ @によって私に注意を喚起していないので、受信箱のメッセージはありません)。とにかく、私は自分の答えを更新しました。助けがあれば、一見をして答えを尋ねます。 – thewaywewere
ページ分割モード(PSM)を7に変更しても機能します。私は内部的に何が起こったのか分かりません。私の苦労は今、私がどのpsmを使用する必要があるかを私がどのように特定するのかです。 – kant01