5

で数ヶ月を過ごした後、自分のモデルを正常に訓練することができました。たとえば、私のモデルよりも、私はImageNetを1000クラスでトレーニングすることができました。Region CNN(R-CNN)を使ってImageNetモデルをトレーニングしよう

私のプロジェクトで、私は自分の興味クラスの領域を抽出しようとしています。その後、私はFast R-CNNのデモをコンパイルして実行しましたが、問題なく動作しますが、サンプルモデルには20クラスしかなく、もっとクラスが必要です。

ImageNetのbounding boxesを実際の画像とともにダウンロードしました。

今、私は空白になりました。私は次のステップを理解することができず、それを行う方法に関する文書はありません。私が見つけた唯一のことは、INRIAの人物モデルを鍛える方法であり、データセット+注釈+ Pythonスクリプトを提供します。

私の質問は以下のとおりです。

  • は、私が見逃しているかもしれない任意のチュートリアルやガイドはありますか?
  • イメージを分類してバウンディングボックスを抽出できる1000クラスの訓練を受けたモデルは既にありますか?

ありがとうございます。

よろしくお願いいたします。

ラファエル。

答えて

4

Dr Ross Girshikは、オブジェクト検出に関する多くの作業を行っています。 fast RCNNの彼の詳細なgitから多くを学ぶことができます。そこにはデモでcaffeブランチを見つけることができます。私はそれを自分で使っていませんでしたが、それは非常に分かりやすいようです。

興味深い別の方向は、LSDAです。弱い監視を使用して、多くのクラスのオブジェクト検出を訓練します。

ご参考までに、faster-rcnnを調べましたか?

+0

こんにちは@Shai、お返事ありがとうございます。正直言って私はLSDAか高速のRcnnについては知らなかったが、私は両方を素早く見ようとしている。 LSDAは明らかであるようです。 Ross Girshikのことは、通常のCaffeのような "ダウンロードセット"がないので、訓練の仕方を理解できないということです。事前訓練されたモデルまたは20種類の訓練モデルしかダウンロードできません。おそらく私が必要とする詳細をいくつか渡したので、残りのフレームワークを見て答えを更新するので、あなたが言いたいことが「明確」であるかどうかを深く見ていきます。ありがとうございました! –

+0

@RafaelRuiz AFAIK fast-rcnn gitは、VOCアノテーションに基づいたトレーニングスクリプト(Pythonで)を持っています。私は(自分で試してみませんでした)それは他の注釈付きセットでも動作するように変更できます。 – Shai

+0

私は試してみる、ありがとう。私はこのスクリプトを見たことがありますが、INRIAの人型モデルのような他のドキュメントと混同されていました。\ –

関連する問題