2017-08-02 7 views
0

私は大学のプロジェクトから始めて、画像内の特定のオブジェクトからピクセル単位の座標(X、Y)を見つけるのに役立つツールを探しています(私はテキストについて話しません)。 IBM Watsonの視覚的認識がこの目標を達成するために私を助けてくれるかどうか、あるいはもっとうまくいく他のツールが分かっているかどうかを知りたいです。IBM Watson視覚的認識。特定のオブジェクトからX、Y座標を取得することは可能ですか?

ありがとうございます。

答えて

1

ここで説明するようにあなたがまた、ハイブリッド「クラウドエッジ」アプローチを取ることができます。https://medium.com/unsupervised-coding/dont-miss-your-target-object-detection-with-tensorflow-and-watson-488e24226ef3

それは領域を検出するために、ローカルで実行しているTensorFlowモデルを使用していますが、その後、各領域にあるものを言ってワトソンVRを使用しています。これは、TensorFlowの柔軟性とWatson VRが数多く(数万種類)の異なる種類のオブジェクトを分類する能力を組み合わせたものです。

1

ワトソンの視覚認識でこれを行うことができます。まず、あなたが探しているオブジェクトを「見つける」ために、カスタムの分類子を訓練する必要があります。これを済ませたら、中途半端なことです。

2番目の部分は、オブジェクトを検索し、4つの部分(左上、左下、右上、右下)に分割するイメージです。次に、ターゲットオブジェクトのイメージの各部分を検索します。これらの象限の1つで見つけた場合は、その象限を4つの部分に分割し、それぞれの部分を対象オブジェクトとして検索します。続行し、これを再帰的に実行すると(各四分円と四分円のピクセル境界を追跡する)、最終的に検索対象のオブジェクトを絞り込みます。

他の検索アルゴリズムも実行する必要があります。あなたのターゲットオブジェクトがイメージの中心にある場合を考えてください - それはANY象限に現れません。あなたのオブジェクトが象限の境界にまたがっている場合は、正確な位置を取得できないため、複数の検索パターンが必要ですが、戦略とアプローチは同じです。

関連する問題