opencvとC++でTesseractライブラリを使用して、数字と文字の両方を含む画像をOCRしようとしています。たTesseractライブラリを呼び出す前に、私は、これがこのイメージのopencv BGR2GRAYとピロー変換関数の違い
OCR結果であるOpenCVのと規模に画像をグレーに
cvtColor(roiImg,roiImg,CV_BGR2GRAY);
を使用することは100%正確ではなかったです。
次に、pythonを使用したピローライブラリで同じ画像をテストしました。原画像は、以下の方法を用いてグレースケール化された。
gray = image.convert('L')
これは、
後者が100%正確な結果が得られたグレースケーリング画像が記載されています。
インターネットで検索したところ、opencv BGR2Grayとpillow img.convertメソッドの両方で同じルーマ変換アルゴリズムが使用されていると言われました。
2つの異なるOCR結果の理由は何ですか?予め
おかげ
OpenCVのがデフォルトでBGRを使用するが、あなたから変換されますRGBからグレー( 'CV_RGB2GRAY')。それは 'CV_BGR2GRAY'ではないでしょうか? –
@Hi私は正しいです。私はコードを編集しました。なぜこれが起こっているのか? –
@Hiの後も同じ問題が発生していますが、私はFrogattoの提案ですか? – NAmorim