Region CNN（R-CNN）を使ってImageNetモデルをトレーニングしよう

caffeで数ヶ月を過ごした後、自分のモデルを正常に訓練することができました。たとえば、私のモデルよりも、私はImageNetを1000クラスでトレーニングすることができました。Region CNN（R-CNN）を使ってImageNetモデルをトレーニングしよう

私のプロジェクトで、私は自分の興味クラスの領域を抽出しようとしています。その後、私はFast R-CNNのデモをコンパイルして実行しましたが、問題なく動作しますが、サンプルモデルには20クラスしかなく、もっとクラスが必要です。

ImageNetのbounding boxesを実際の画像とともにダウンロードしました。

今、私は空白になりました。私は次のステップを理解することができず、それを行う方法に関する文書はありません。私が見つけた唯一のことは、INRIAの人物モデルを鍛える方法であり、データセット+注釈+ Pythonスクリプトを提供します。

私の質問は以下のとおりです。

は、私が見逃しているかもしれない任意のチュートリアルやガイドはありますか？
イメージを分類してバウンディングボックスを抽出できる1000クラスの訓練を受けたモデルは既にありますか？

ありがとうございます。

よろしくお願いいたします。

ラファエル。

出典

2015-10-13 Rafael Ruiz

Dr Ross Girshikは、オブジェクト検出に関する多くの作業を行っています。 fast RCNNの彼の詳細なgitから多くを学ぶことができます。そこにはデモでcaffeブランチを見つけることができます。私はそれを自分で使っていませんでしたが、それは非常に分かりやすいようです。

興味深い別の方向は、LSDAです。弱い監視を使用して、多くのクラスのオブジェクト検出を訓練します。

ご参考までに、faster-rcnnを調べましたか？

出典

2015-10-13 11:21:26 Shai

こんにちは@Shai、お返事ありがとうございます。正直言って私はLSDAか高速のRcnnについては知らなかったが、私は両方を素早く見ようとしている。 LSDAは明らかであるようです。 Ross Girshikのことは、通常のCaffeのような "ダウンロードセット"がないので、訓練の仕方を理解できないということです。事前訓練されたモデルまたは20種類の訓練モデルしかダウンロードできません。おそらく私が必要とする詳細をいくつか渡したので、残りのフレームワークを見て答えを更新するので、あなたが言いたいことが「明確」であるかどうかを深く見ていきます。ありがとうございました！ –

@RafaelRuiz AFAIK fast-rcnn gitは、VOCアノテーションに基づいたトレーニングスクリプト（Pythonで）を持っています。私は（自分で試してみませんでした）それは他の注釈付きセットでも動作するように変更できます。 – Shai

私は試してみる、ありがとう。私はこのスクリプトを見たことがありますが、INRIAの人型モデルのような他のドキュメントと混同されていました。\ –

Region CNN（R-CNN）を使ってImageNetモデルをトレーニングしよう

答えて

関連する問題