テンソルフローと畳み込みニューラルネットワークを使用してオブジェクトを検出してローカライズするにはどうすればよいですか？次のように

「物体検出とローカライズTensorflowを使用して畳み込みニューラルネットワーク」私がやったこと

？

私はtflearnライブラリを使って画像から猫の検出を行いました。私は25000枚の猫の画像とそのうまくいった罰金を正確に訓練しました。

現在の結果：私がやりたいこと

？

私の結果は「猫と犬である必要があり、これとは別に、私はの正確な場所を見つけなければならないので、私のイメージは、一緒に例の猫と犬のための2つで構成されたり、同じ画像で二つ以上のオブジェクト場合画像（バウンディングボックス）

上のこれらの2つのオブジェクトが私はダークネット、SSDが、その背後に概念を得ることができないように、多くの高レベルのライブラリに出くわしました。

私はこの問題を解決する方法について教えてください。

注：私は教師あり学習テクニックを使用しています。

期待される結果：

あなたはそれについて移動するには、いくつかの方法があります。

最も直接的な方法は、選択的検索のようないくつかのバウンディングボックス提案アルゴリズムを使用して提案されたバウンディングボックスを取得し、あなたがすでに訓練した分類ネットを提案上で実行することです。このアプローチは、R-CNNのアプローチです。

上記のアプローチに基づくより高度なアルゴリズムについては、Fast-R-CNNとFaster R-CNNについてお読みください。

いくつかの基本的な説明はObject detection with R-CNN?をご覧ください。

がダークネットとSSDは異なるアプローチに基づいており、あなたがそれらをundestandしたい場合は、

2017-07-12 09:18:03

にそれらについて読むことができる音像定位は、多くの異なる実装が同じ結果を達成することと複雑な問題です異なる効率で。

実装の2つの主要なタイプの回帰と

-Localizeオブジェクト

- シングルショット検出器

乾杯

2017-07-13 11:28:11

答えて