文字を検出すると、それぞれの境界ボックスが表示されます。おおよその文字の大きさを知っているような、いくつかの仮定があります。それをSと呼んでください。これは、検出されたすべての境界ボックスのサイズから推測できます。あなたは次のことを試みることができるこれに基づき
:
- 検出された各バウンディングボックス(D_bbox)のために、この検索では2 * S
- 、±バウンディングボックスの中心からの検索範囲を定義します探索領域内にある各中心について、他の検出された文字
- から他の境界ボックス中心(O_bbox)を探し、D_bboxとO_bboxの比を計算します。指数文字のサイズが数よりも小さくなければならない=> D_bbox/O_bbox> 1.
私はそれが約1.5であるべきだと思いますが、これは値を再生し、何を参照するフォントなどに依存あなたは得る。
- D_bbox_centre_x < O_bbox_centre_x
- D_bbox_centre_y < O_bbox_centre_y
数は指数の左に常にあり、それは、中心が常にオンに低いです:
役立つかもしれないいくつかの他のヒューリスティック
ページの指数部の中心よりも大きい。
括弧を検出しようとしません。指数を書くために使用しない場合があるからです。