TensorFlow Image Recognition APIを実行してオブジェクトを検索する

TensorFlowには、オブジェクトを識別するための開始v3モデルを使用するAPIがあります。大きな画像に小さな画像を配置する方法があれば、私は疑問に思っていました。たとえば、すべてのオレンジをオレンジ色のツリーに配置します。私は大きな画像を小さい画像のグリッドに分割し、個々の小さな画像にテンソルフローを適用することを試みましたが、一定のグリッドを持つことは非常にエラーを起こしやすいです。TensorFlow Image Recognition APIを実行してオブジェクトを検索する

出典

2016-12-27 Rehaan Ahmad

あなたが探している用語は、オブジェクト検出です。異なるスケールでスライディングウィンドウを使用することができます。これは一つの方法ですが、そこにはおそらく良いものがありますが、私はそれらが何であるか分かりません。

いくつかのオレンジは他のオレンジよりも近いとします。左上隅にある10x10（または何か）のボックスから始め、モデルがオレンジ色に分類されているかどうかを確認します。右の2ピクセル（または何か）にボックスを移動します。再試行する。右に移動し、2ピクセル下に移動して新しい行などを開始します。イメージを小さく（今は大きなオレンジを探しています）するようにイメージのサイズを変更し、プロセス全体を繰り返します。あなたは、 "スライディングウィンドウの検出"や "画像ピラミッド"のようなものを見つけることができます。

一度画像を読み取れば、多くの検出が行われます。非最大抑制を実行する方法を見つけ出す必要があります。

出典

2016-12-27 04:38:23

TensorFlow Image Recognition APIを実行してオブジェクトを検索する

答えて

関連する問題