caffeで数ヶ月を過ごした後、自分のモデルを正常に訓練することができました。たとえば、私のモデルよりも、私はImageNetを1000クラスでトレーニングすることができました。Region CNN(R-CNN)を使ってImageNetモデルをトレーニングしよう
私のプロジェクトで、私は自分の興味クラスの領域を抽出しようとしています。その後、私はFast R-CNNのデモをコンパイルして実行しましたが、問題なく動作しますが、サンプルモデルには20クラスしかなく、もっとクラスが必要です。
ImageNetのbounding boxesを実際の画像とともにダウンロードしました。
今、私は空白になりました。私は次のステップを理解することができず、それを行う方法に関する文書はありません。私が見つけた唯一のことは、INRIAの人物モデルを鍛える方法であり、データセット+注釈+ Pythonスクリプトを提供します。
私の質問は以下のとおりです。
- は、私が見逃しているかもしれない任意のチュートリアルやガイドはありますか?
- イメージを分類してバウンディングボックスを抽出できる1000クラスの訓練を受けたモデルは既にありますか?
ありがとうございます。
よろしくお願いいたします。
ラファエル。
こんにちは@Shai、お返事ありがとうございます。正直言って私はLSDAか高速のRcnnについては知らなかったが、私は両方を素早く見ようとしている。 LSDAは明らかであるようです。 Ross Girshikのことは、通常のCaffeのような "ダウンロードセット"がないので、訓練の仕方を理解できないということです。事前訓練されたモデルまたは20種類の訓練モデルしかダウンロードできません。おそらく私が必要とする詳細をいくつか渡したので、残りのフレームワークを見て答えを更新するので、あなたが言いたいことが「明確」であるかどうかを深く見ていきます。ありがとうございました! –
@RafaelRuiz AFAIK fast-rcnn gitは、VOCアノテーションに基づいたトレーニングスクリプト(Pythonで)を持っています。私は(自分で試してみませんでした)それは他の注釈付きセットでも動作するように変更できます。 – Shai
私は試してみる、ありがとう。私はこのスクリプトを見たことがありますが、INRIAの人型モデルのような他のドキュメントと混同されていました。\ –