2017-03-26 17 views
0

テキストから太字のテキストを取得するのには苦労しています。私はここに画像を添付しました。 Original Image太字のテキストでOCRを行うTesseract

私はOpenCVのを使用して画像の色を反転し、私はたTesseractは、テキスト出力として5を与えたいと思うが、私は空の値を取得Inverted color

にそれを変更しました。

複数行のテキストを含む画像。この画像データは、両方の画像がpsm7に設定8、又は9と認識することができるPSM 7,8または9

Multiline text image
+0

ページ分割モード(PSM)を7に変更しても機能します。私は内部的に何が起こったのか分かりません。私の苦労は今、私がどのpsmを使用する必要があるかを私がどのように特定するのかです。 – kant01

答えて

1

を用いて抽出されていません。 3.x.xを使用している場合は、Tesseract 4.0.0 alphaを使用してOCR結果を改善することを提案し、--psm 9を使用してください。

Page segmentation mode: 
    7 Treat the image as a single text line. 
    8 Treat the image as a single word. 
    9 Treat the image as a single word in a circle. 

このヘルプが必要です。

EDIT:

使用するPSM識別するために、オンザフライであなたの追加質問については、あなたが使用することをpsm値を決定するために、画像の高さを確認することがあります。

たとえば、5の高さは80で、foxメッセージは480です。ピクセル値では、psmの値を設定するコードを実装する方が簡単です。

+0

ありがとう、これは役に立ちます:) 私は複数の画像でOCRをやっています。他のイメージの場合は、複数の行にテキストがある場合、どのイメージをどのpsmで使用するのかをどうやって特定するのですか? – kant01

+0

@ kant01投稿を編集して、複数の行の画像サンプルを含めることはできますか? – thewaywewere

+0

@ kant01あなたのEDITを見ただけです(あなたが@ @によって私に注意を喚起していないので、受信箱のメッセージはありません)。とにかく、私は自分の答えを更新しました。助けがあれば、一見をして答えを尋ねます。 – thewaywewere

関連する問題