2016-07-13 5 views

答えて

4

どのくらいのデータを使用できるかは、コンピュータに搭載されているRAMの容量の関数です。だから多分あなたは、それぞれの画像の大きさとあなたのRAMの量に応じて多くのことを練習することができます。

さらに重要なことは、dlibのHOG + SVM検出器について質問していることでしょう。顔検出器を訓練する場合、450Kの顔はHOG + SVMのリターンが減少する点をはるかに超えています。たとえば、非常に正確なdlib付属の正面検出器は、小さな62MBのデータセット(この1つはhttp://dlib.net/files/data/dlib_face_detector_training_data.tar.gz)でのみトレーニングされています。このような種類の検出器を数千個以上の画像でトレーニングしても、それ以上の精度は得られません。

あなたのデータにポーズの変動性がたくさんある場合、HOG + SVMはそれをキャプチャすることができません。その場合には、ポーズ毎に1つずつ、複数の検出器を訓練するのが最善の方法です。 dlibのimglabツールの--clusterオプションを使用すると、データセットを異なるポーズに自動的にクラスタ化できます。

+0

私はそれがとても正確だとは思わない。例えばhttp://ia.media-imdb.com/images/M/[email protected]_V1_SY1000_CR0,0,665,1000_AL_.jpg – erogol

+1

私はこのサンプルプログラムを実行しました(http://dlib.net/face_detection_ex.cpp) .html)を見つけて、カメラを見ているすべての顔を検出しました。 –

+0

奇妙な。修正をありがとう、私はこれを確認します。 – erogol

関連する問題