1

イメージの領収書から総請求額を抽出します。私は画像に存在するデータ全体を抽出することができましたが、今私は必要な情報だけを抽出するという問題に苦しんでいます。ADHoc情報の取得

これは私が持っている画像です。

enter image description here

私はちょうど総法案を抽出したいこのデータから画像

m cm lnnk 3mm: :33; no 1 z m 
x Visut all! ms“; (or nulnunn mfn an an: nan. 



Sub Iota] 19.56 
TOTAL 19.56 
VISA 1956 
Fun 19.56 
D!!! You Know 0 



For ureat-tastlru dessens under 200 
cahries, try our Triple Berry Frozen 
Yogurt Sunda: a dish of Frozen Yogurt. 
or a Vanma rozen Vugurt Done. 

から抽出した情報を貼り付けています。これを得るために、Ad Hoc Normalization(アドホック検索)を使用できることがわかりました。誰かがアドホック検索の洞察を提供できるか?イメージからデータを抽出する他のオプションがある場合は、そのようにしてください。私はこの情報を抽出するためにtesseractを使用しています。場合によっては適切な出力が得られない場合もあります。私はtesseractによって与えられた出力を即興に役立つことができます。

+0

少し詳しい情報を追加できますか?希望の出力は "19.56"ですか?これは複数の請求書を実行する必要がありますか? – shiri

答えて

0

この場合、なぜアドホック検索が必要ですか?領収書からOCRの結果を取得しているので、「TOTAL」の横に表示されているアイテムを通常のテキスト検索で簡単に検索できます。

イメージテキスト検索のアルゴリズムがありますが、これは正当な理由がない限り、このような単純なアプリケーションでは過剰なものです。

関連する問題