2017-06-22 21 views
1

私はMicrosoft OCR APIを使用していますが、画像からテキストを取得していますが、テキストが特定の色か特定の背景色かどうかを知りたいと思います。例えばテキストの色を取得するにはどうすればよいですか?

I以下の画像を持っていると私は、この行と考え i.e. image

赤でテキストがあるかどうかを知りたい:

string requestParameters = "language=unk&detectOrientation=true"; 

パラメータを確立するために私を助けるだろうが、I私は単語の行の色を知りたければ、イメージから受け取ることが好きです。そこで、次のような視覚的な機能を追加しました:

string requestParameters = "visualFeatures=Color,language=unk&detectOrientation=true"; 

しかしこれで問題は解決しませんでした。

また、イメージ分析のuriBaseリンクとOCRのuriBaseリンクを混在させることはできますか?

+0

サードパーティのサービスを呼び出すための独自のURLパラメータを作成することは、奇妙な考えです。 [ドキュメント](https://southeastasia.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fc)を見ると、色を取得するためのURLパラメータは定義されていません。一方、[この例](https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/python)では、 'Color'と一緒に' visualFeatures'パラメータを使用しています。 –

+1

あなたは正しいと思います。 URLがマイクロソフトから提案されているので、私はこの可能性を否定します。イメージを分析するときには、カテゴリ、descrition(タグ)や色などの視覚的な機能を得ることができます。そのため、OCRのリクエストパラメータを使用してイメージの解析から要求パラメータを混合しただけです。私はuriBaseが異なっていたことに気付かなかった。 –

答えて

2

現在、1回の呼び出しでカラー情報とOCR結果を取得する方法はありません。

OCRから返されたバウンディングボックスを使用して元のイメージをトリミングし、visualFeatures = colorのanalyze endpointにトリミングして、検出されたテキストの色情報を取得できます。

+0

uriBase(画像解析とOCRの両方)を同時に使用する方法はありませんか?私は排他的なイメージ分析の権利のための別の方法を構築する必要がありますか? –

+0

はい、OCR要求は/ ocrに行きますが、分析は/ analyzeに行きます。 最初に/ ocrを呼び出す必要がありますか?language = unk&detectOrientation = true次に/ analyzeを呼び出すと、visualFeatures = color –

0

documentationによると、このAPIの可能リクエストパラメータは次のとおりです。

言語、detectOrientation

と返されたメタデータは、これらのエンティティがあります。

オリエンテーション、言語を、領域、行、単語、バウンディングボックス、テキスト

OCRアルゴリズムをコンピュータビジョンアルゴリズムの別のものと組み合わせて、OCRが特定したテキスト領域の支配的な色を検出することができます。

関連する問題