私は畳み込みニューラルネットワーク(CNN)を使用しています。トレーニング/検証/テストセットを分割する方法が正しいかどうか尋ねたいだけです。トレーニング検証顔面データセットのテストセットを分割
私は合計55人の対象を持っています。 私は、トレーニング(45人の対象)、検証(目に見えない5人の対象)、テスト(目に見えない6人の対象)のために80-10-10に分割する予定です。
妥当性検査セットは、見えない被験者から構成されるべきですか?または、トレーニングセット全体をシャッフルし、その一部(10〜20%)を検証セットとして使用できますか?
N-Foldクロスバリデーションを使用すると、トレーニングセット(インスタンス)全体がシャッフルされ、Nつ折りに分割され、モデルはトレーニングされ、N回平均化されます。 しかし、ニューラルネットワークまたはCNNの場合、非常に計算コストが高いため、クロスバリデーションは使用しません。
私は、目に見えない被験者の検証セットを使用してから正しいと思いますが、私のモデルは3〜5エポック後にオーバーフィットし始め、全く学習しません。 一方、トレーニングセットの10〜20%を検証セットとして使用すると、私のモデルは3層CNNを使用して妥当な精度(45〜50%)で学習しますが、見えないテストセットでテストした場合、トップ1精度は15-16%程度です。
ありがとうございました。
CNNを開発するときに最初に質問する必要があるのは、フィードを供給するのに十分なデータがある場合です。どのくらいの数の画像が被写体ごとにありますか? 100未満の場合は、より多くの訓練データが適切な動きであることを示すことをお勧めします。私も10 000以上のトレーニング画像を取得することをお勧めします。 –
@ThomasPinetz私は500kのデータを持っています。各科目には100のビデオクリップがあり、合計で5500本のビデオクリップが平均で約2〜5秒です。データは十分だと私は思っていますが、分割が正しければ質問しています。 – Renz