2016-09-05 5 views
0

私はカスタムデータセットのためにcaffeを使ってより速いRCNNを訓練しようとしています。私は、高速RCNN caffeモデルが600 * 1000の入力イメージサイズを考慮して構築されていることを認めました。カスタムデータセットに300 * 400のサイズの画像がたくさんあります。サイズ600 * 100まで画像をゼロにする必要がありますか、それとも高級ですか?どちらにも該当しない場合は、ネットワークに入力する前に画像を適切に修正する必要があります。提案してください。より速いRCNN caffeモデルには適切な画像サイズの入力が必要ですか?

ありがとうございます。

+0

frcnnの基本的な 'config'を変更しないと、画像がアップスケールされていると思います。入力サイズは、検出するオブジェクトの予想サイズを反映する必要があります。 – Shai

答えて

2

速いRCNNは、あなたのイメージとかなり近いイメージサイズ(パスカルVOCでは約500×375)のパスカルVOCイメージで訓練されました。イメージをゼロにする必要はありません。元のpythonコードを使用すると、プロセス全体の一部になります。私はあなたがそのまま使えると思う。

私の意見では、画像が大きく、オブジェクトが小さい場合は、入力画像のサイズを変更する必要があります。

たとえば、3000x4000の画像があり、検出する100x100のオブジェクトがあります。 600x1000にサイズ変更すると、オブジェクトは25x25に近づきます。しかし受容野はネットワークでハードコードされている(それぞれZFとVGGでは171と228ピクセル)。だから、この場合、私の目的はこの受容野に関しては非常に小さいでしょう。それは、ポジティブを記述する機能が、実際にはフォアグラウンドより多くの背景情報を含んでいることを意味します...

この場合、最良のアプローチはトレーニングフェーズの画像をカットすることですテスト)。

関連する問題