2017-11-13 19 views
-2

enter image description here画像から特定の部分のみを抽出する方法は?

こんにちは、私は、image.Likeの特定の部分だけを抽出するアンドロイドアプリを構築例えば、上記電話番号が含まれている画像の一部のみを抽出してOCRを使用するタスクを持っていますその部分のテキストを抽出する。

イメージからテキストを抽出するためのGoogleのテキスト認識APIはすでに実装されていますが、うまく機能しますが、すべてを抽出する必要はなく、特定の部分だけを抽出します。

これは可能ですか?もしそうなら、どのようなテクニックを使ってこの問題を解決すべきですか?

は、任意のコンテキストがなければ、あなた

+1

どのようにイメージのどの部分を抽出するかを選択しますか? – StephaneM

+0

それは私が解決しようとしていることです、私はアルゴリズムが画像のどこから抽出するかを知りたい – Ahmad

答えて

1

をありがとう、私は(この例では)電話番号があるかどうか、どこが実際に特定することができるかどうかわかりません。私の謙虚な意見で、簡単な質問はいいえではありません。

しかし、問題のドメインを少し変更することができれば、あなたがしようとしていることをやることができると思います。

私はそれが単純であることを意味します。そのRXの画像が撮影される前に、写真を撮っている人またはその文書をスキャンしている人にの電話番号フィールドをハイライト表示するように頼むことができますか?または、電話番号をボックスに入れるように頼むことができますか? (または単に、電話番号を残りの情報と変えてください)。彼らがそうすることができれば、強調表示された部分を見つけ出すことができます(または、ボックスを探すか、電話番号フィールドを区別するために他のものを探してください)。

私は、この解決策は人間の介入を必要とし、エラーが発生しやすく、問題のあるドメインでうんざりする必要があることを知っています。ただし、問題を解決する可能性があります。 :)

0

唯一の一般的な技術は、実際の人に抽出する領域を指定する(すなわち、マウスを使用する)ことを求めることであろう。しかし、人が疲れて退屈し、賃上げを求めるなどの場合には失敗します。

電話番号がどこにあるかを知っていれば(たとえば、上から50ピクセル)、それに基づいて見つける。しかし、スキャン時に文書が揃えられていない場合、矛盾して配置されている場合など、これは失敗します。

しかし、率直に言って、最も信頼性が高く安価な解決策は、画像全体をOCRし、OCRの文字に基づいて電話番号を特定することです。

関連する問題