太字のテキストでOCRを行うTesseract

テキストから太字のテキストを取得するのには苦労しています。私はここに画像を添付しました。 Original Image 太字のテキストでOCRを行うTesseract

私はOpenCVのを使用して画像の色を反転し、私はたTesseractは、テキスト出力として5を与えたいと思うが、私は空の値を取得 Inverted color

にそれを変更しました。

複数行のテキストを含む画像。この画像データは、両方の画像がpsm7に設定8、又は9と認識することができるPSM 7,8または9

出典

2017-03-26 kant01

ページ分割モード（PSM）を7に変更しても機能します。私は内部的に何が起こったのか分かりません。私の苦労は今、私がどのpsmを使用する必要があるかを私がどのように特定するのかです。 – kant01

を用いて抽出されていません。 3.x.xを使用している場合は、Tesseract 4.0.0 alphaを使用してOCR結果を改善することを提案し、--psm 9を使用してください。

Page segmentation mode: 
    7 Treat the image as a single text line. 
    8 Treat the image as a single word. 
    9 Treat the image as a single word in a circle.

このヘルプが必要です。

EDIT：

使用するPSM識別するために、オンザフライであなたの追加質問については、あなたが使用することをpsm値を決定するために、画像の高さを確認することがあります。

たとえば、5の高さは80で、foxメッセージは480です。ピクセル値では、psmの値を設定するコードを実装する方が簡単です。

出典

2017-03-27 14:15:39 thewaywewere

ありがとう、これは役に立ちます:) 私は複数の画像でOCRをやっています。他のイメージの場合は、複数の行にテキストがある場合、どのイメージをどのpsmで使用するのかをどうやって特定するのですか？ – kant01

@ kant01投稿を編集して、複数の行の画像サンプルを含めることはできますか？ – thewaywewere

@ kant01あなたのEDITを見ただけです（あなたが@ @によって私に注意を喚起していないので、受信箱のメッセージはありません）。とにかく、私は自分の答えを更新しました。助けがあれば、一見をして答えを尋ねます。 – thewaywewere

太字のテキストでOCRを行うTesseract

答えて

関連する問題