2つまたは3つのフォントしか使用されていない文書の白黒画像があるとします。 3つのうちの1つはタイトルのために使用され、もう1つは小さなフォント(または少なくとも非常に明白)です。例えば、テキストの小さなビットの1つは次のようになります。OCRと2つまたは3つのフォントの区別
Fancy/Bolded/Italicized/Script font: The Best Soup In The World
Plain/small: Made with tap water, salt, and sugar.
Fancy/Bolded/Italicized/Script font: The Best Soup and 1/2 Sandwich In The World
Plain/small: Made with flour, tap water, salt, and sugar.
私は「Bestスープ」はイタリックの/ etcと特定のファンシーフォントを使用することを私に伝えることができ、大きな派手なOCRシステムを必要としません。私は「ベストスープ」が「水道水」とは多少異なってフォーマットされていること、「ベストスープ」と「サンドイッチ」はおそらく同じフォーマットを使用しており、「サンドイッチ」は「タップ」よりも大きい/水。"
実際のOCRとバウンディングボックスの検出(http://www.mail-archive.com/[email protected]/msg02157.html)を行うにはTesseractを使用します(該当する場合)。
この単純な書式の分類を行うために使用できるものはありますか?
編集:
は私の腕と脚の原価計算せずにこれを行いますそこにはありますか?
静かにあなたの会社を押している間に役立つ応答を提供してくれてありがとう。 :) 私は、私が請求するかどうかを決定していないので、私は他の可能性を引き続き検討します。 –