(Iない専門家ではなく、好奇心で、この記事を書く)
IMHO、この問題は、ブルートフォース試行錯誤のアプローチと効果的にコストを解決することができます。あまりにも多くの間違った方向があることができないためです。
私はあなたが簡単にテキストの境界ボックスを判断できると思います。このバウンディングボックスは、2つの方法でのみ間違った向きを持つことがあります。時計を賢く回転させたり、時計回りに回転させたりします。したがって、画像を最大で2回転すると(境界ボックスを直立させる回転)、正しい方向を見つけることができます。
つまり、イメージをさらに処理せずに正しいドキュメントの向きを見つけて、テキストの配置を判断できます。そして、テキストの整列を決定することは、私が思うとかなり大きな処理になります。
UPDATE
私たちは、正確な回転角度を見つける必要がないことを示唆しています。ボンディングボックスが直立している場合は、直角または180度の回転角度にすることができます。
1)、結果を確認し、OCRを実行直立ボンディングボックス
2)を行い、OKであればその
3)は180度
2)OCRを実行を回転させて行わ。今度は直角でなければなりません
実際に正確な回転角度を見つけなければならないのなら、文字 'o'、 'c'、または 'm'の斜体フォント)。または、ピリオド( '。')の相対的な位置を見つけます。これは複雑な操作を必要とすると私は思う。
イメージは常に約90度回転しますか? –