2016-04-07 11 views
0

dlibINRIA Person Datasetを使用して歩行者検出器を訓練しようとしています。dlibを使用して歩行者検出器を訓練する最良の方法

これまで私は27枚の画像を使用していましたが、トレーニングは高速ですが、結果は満足できません(歩行者はほとんど認識されません)。ここに私の訓練の結果は、(中/ exmaplesディレクトリ)DLIBが付属していますtrain_object_detectorプログラムを使用している:

の保存が

...学習データに

テスト検出器をobject_detector.svmする検出器を訓練し

テスト検出器(精度、リコール、AP):1つの0.653061 0.653061

パラメータを使用:

スレッド:4

C:1

EPS:0.01

ターゲットサイズ:6400

検出窓幅:47

検出ウィンドウ高さ:この何倍アップサンプリング137

:0

私は、より良い結果を得るためにトレーニングに他のイメージを追加する必要があることを認識していますが、その前に結果(精度、リコール、AP、c、eps、 ...)私はあなたがトレーニングに関する勧告を持っているかどうかも疑問に思っています。何枚の画像が必要ですか?画像内のすべてのオブジェクトに注釈を付ける必要はありますか?画像の一部の領域を無視する必要がありますか? ...

私の結果を比較するために使用できる訓練された検出器(svmファイル)はありますか?

答えて

1

私は特にDLIBに慣れていないけど、私はあなたが27個のイメージで良い結果を得ることはありませんことを教えてみましょうあなたの答えをいただき、ありがとうございます。一般化するために、あなたの分類器はの種類が多く、データの種類はです。それは同じ服を着て、同じ人の10,000のイメージをそれに供給することをあなたに何もしません。あなたは、人、衣服、セッティング、アングル、ライティングを変えたいと思っています。 INRIAデータセットはそれらの大部分をカバーする必要があります。

検出ウィンドウのサイズとアップサンプルの設定によって、訓練された分類器が画像を確実に検出するために画像をどのくらい大きく見なければならないかが決まります。あなたの設定では、137/47ピクセルの高さ/幅の1スケールの人しか検出されません。一度でもアップサンプリングすれば、より小さなスケールで人を検出することができます(アップサンプリングは人をより大きく見せます)。より大きなデータセットを使用し、アップサンプリング数を増やすことをお勧めします(ライブラリに組み込まれていると思われる別のディスカッションがどれだけアップサンプルされているかによって)。物事は時間がかかりますが、それはトレーニング分類子の性質です - パラメータを微調整し、再学習し、結果を比較してください。

精度/リコールについては、thisウィキペディアの記事を参照してください。これらはパラメータではなく、分類子の結果です。できるだけ1に近づけたい。

関連する問題