画像から単語の個々のイメージを抽出する方法は？

私は、主に異なるタイプのフォントで文章を持つ画像から単語の画像を抽出しようとしています。たとえば、このシナリオを考えてみます。

画像から単語の個々のイメージを抽出する方法は？

今、私はこのようなので、上の言葉クリントン、ストリートとの個々の画像を抽出したい：私はバイナリ拡張を適用しようとしたが、

を白と黒の領域の間の距離は、単語を切り取るのにほとんど無視できました。しかし、最初に元の画像の空白部分を切り取った後、F1値が小さい切り取った画像に対して2進拡大を再実行すると少しうまくいきました。

この画像と単語の画像を分離するには、どのような最高と高精度のアプローチが必要ですか？

Ps：私はこのブログに従っていますpost私は仕事を手伝ってくれます。

が拡張して、あなたに
フェネック

2017-01-17 Fennec

をありがとう、私はこれを取得：

は以下のように（なぜならラインがによってあまりにも近いかもしれないという事実をあなたのために満足のいく本ではなく、拡張と一緒に合併しましたそれは最後の2行のために起こります）？

-clusteringを：私の頭の上から、試して

その他のもの。

- 各行のピクセル数をカウントして、行の位置を特定し、各列のピクセルを数えて、各行内の単語の位置を特定します。

2017-01-17 08:24:31 Soltius

@ソリタスこの情報はありがとうございます。私はそれを使用して最終結果を達成することができると思う。 – Fennec

答えて