私は表情認識の分野ではかなり新しいです、そして、現在、私はディープラーニング、特にCNNでこれに関する研究をしています。データの準備や前処理に関する質問があります。CNNの表情認識データの準備
私は正面の表情の動画を分割しました(たとえば、アノテーションに基づいて幸せな感情を表現する人の動画を2〜3秒間)。
注:今、どのように私はCNNとの訓練のための私のデータを準備する必要があります(I:私の参加者が表示された表現は、非常に低強度(ない誇張表現/マイクロ表現)
一般的な質問であります深い学習ライブラリ、TensorFlowを使用して少し傾いていますか?
質問1:私は読んだことがあるいくつかの深い学習に基づく表情認識(FER)、その式のピーク(おそらく単一の画像)を取り、あなたのトレーニングデータの一部として、そのイメージを使用することをお勧めの論文。表現のピークをどうやって知ることができますか?私の基礎は何ですか?私が単一のイメージを撮るなら、参加者が表現した表現の微妙なフレームは失われないでしょうか?
質問2:または(例えばビオラ・ジョーンズ)を検出クロップ及びフレーム毎に顔を保存し、私の研修の一環として、これらの画像を使用するためにOpenCVの中にセグメント化されたビデオを実行するようにしても正しいだろう適切なラベルを持つデータ私は顔のいくつかのフレームが重複していると推測しています。しかし、データの参加者が表現の微妙な表現(微表現)を示していることを知っていたので、顔の動きも重要になる可能性があります。
本当にありがとうございました
それは私が言及することを忘れたものです。私のデータには自発的な表情が含まれています。最初は、セッション全体で特定のアクティビティを実行しながら、被験者が記録されていました。セッションの後、彼/彼女は彼/彼女がビデオでの一定期間の間に特定の表現は、例えば幸せであることを考えれば、彼/彼女が幸せになるためにその期間に注釈を付けるだろうここで全体の活動に注釈を付けることが求められています。それがプロセスです。ビデオは、被験者の注釈に応じてトリミングされたので、私は、私はピークを決定するものであろうあれば、それは主観的な判断をかもしれないと思います。おかげ – Renz
は、これはあなたが* *不特定の感情的な状態にあるの対象者自身の評価に、そして、ビデオの上に静止状態を持っていないことを意味します。その場合、私の最初の段落が適用されます。 – Prune
あなた後者の点に言えば、はい、全体の感情を表現するためにビデオクリップを使用することは有用であろう。しかし、現場を理解しておけば、これはあなたのアプリケーションにとって過度のことです。代表的な「ピーク」フレームで十分です。 – Prune