同じレイアウト(厳密なフォームは可変データで塗りつぶされています)のドキュメントのスキャン画像がたくさんあります。 OCR。私は、OCRのプロセス自体に多かれ少なかれ対処することができます(テキストイメージをテキストに変換する)が、スキャンされたイメージが異なる回転、スケーリング、またはその両方によって歪んでいるという厄介な事にも対処しなければなりません。PythonでOCRの前処理としてイメージを「正規化」(スキュー除去、再スケーリング)
私の方法は、ピクセルで境界ボックスとして定義されたそれぞれのセルから情報を読み取ることに焦点を当てているため、すべての画像をすべての対応するセルが同じピクセル位置にある「標準」バージョンに変換する必要があります。 "誤読"。私の質問は、歪んだ画像をどのように「正規化」できるのでしょうか?
私はPythonを使用します。