2017-11-16 10 views
0

何らかの種類のテキスト検出アルゴリズムを実装しようとしていますが、イメージをそれぞれのフォントサイズが異なる領域に分割したいと考えています。例えば、この画像のように異なるフォントサイズのテキスト領域を囲む囲み枠

、: example

のpythonおよび/またはOpenCVのを使用して、それを実装するための簡単な方法はありますか?もしそうなら、どうですか?
私はグーグルで試してみましたが、役に立たないものは何も見つかりませんでした。 ありがとうございました。

+0

[ask]をお読みください。つまり、答えは「はい」です。 – Piglet

+0

この問題を検索しましたが、何も見つかりませんでした... –

答えて

1

これは興味深い質問です。あなたの目標を達成するために必要ないくつかのステップがあります。私が示唆しているステップを理解するために、基本的なコンピュータビジョンアルゴリズム(openCV関数の知識の知識)を十分に知っていれば幸いです。

  1. モルフォロジー拡張プロセスを使用してすべての単語をグループ化します。
  2. すべてのブロブにラベルを付けるには、openCV findcountour関数を使用します。これは、各ブロブの幅と高さの情報も提供します。
  3. それぞれのブロブにデータがあるので、位置(x、y)とジオメトリ(幅、高さ)を持つデータに対してクラスタリングアルゴリズムを実行するようになりました。
  4. 正しくクラスタリングしたら、左端、右端、上端、および下端のデータを見つけて境界矩形を描画します。

私はこれがあなたの仕事を開始するのに十分な情報を提供することを望みます。それは詳細ではありませんが、私はあなたを導くのに十分だと思います。

関連する問題