Tesseract OCRと楔形文字OCRを使用して画像からテキストを取得しようとしています。特定の値以下の色のRGB値が明るい色であることを知る方法はありますか
ただし、テキストが小さいフォントまたはフォントが薄い場合は、結果のテキストにエラーがあります。
テキストを取得するために必要な画像のほとんどは、テキストを濃い色で返し、残りの画像は明るい色にします。だから私はすべての明るい色を白色に変換し、バッファリングされた画像のサイズを大きくして結果のテキストが正しいと考えています。 (私のアプローチが間違っていれば私を訂正してください)。
誰でもテキストがOCRエンジンの薄い/小さすぎる場合には、多くのあなたがそれについてできることはありません、これは本当に便利
私は決して完全にあなたの質問に答えなかったことを認識しました。解決策を反映するために私の答えを編集しました。 –
私はあなたの答えを試みます。私は別のアイデアを得た。 R <125 G <125 B <125の場合、より明るい色となり、rgbの値のいずれかが125より大きい場合は、より暗い色と見なすことができます。 –
グレースケールに変換すると、個々のコンポーネントを確認するよりも安定した結果が得られます。あなたのメソッドが暗い色を定義する特定のケースがありますが、それを見ると明るくなり、その逆もあります。ルミナンスは人間の知覚に最も適しており、第2平均法(R + G + B)/ 3はおそらくOCRに最適です。 –