2017-02-15 16 views
0

私は分類する必要のある7種類の画像があります。各クラスには異なる数のサンプルがあります。クラスごとに異なるデータ数で画像を分類する

  1. 75フォト
  2. 70イメージ
  3. 98フォト
  4. 182フォト
  5. 146のフォト
  6. 197画像Iがすべての画像を削除することになった
  7. 150画像

すべてのクラスで70画像まで(50トレーニングと20バリデーション)。 Kerasとgeneratorとflow_from_directoryメソッドを使用して、それらのすべてを分類することができましたが、私は良い精度を得られないことは明らかです。あとでデータを増やす予定です。

私の質問は、flow_from_directoryメソッドを使用して各クラスに異なる数のトレーニングデータを使用できますか?そして、この方法に潜在的な欠点がありますか? 20検証

  • 50トレーニング - - 20検証
  • 78トレーニング - 20検証
  • ......
  • おかげ

    1. 55トレーニング:例えば

    +0

    私はさまざまなサンプル数が使えると信じていますが、あなたのモデルはより頻繁なクラスに偏っています。比率では、これは問題ではありません。 –

    答えて

    0

    でも可能ですが、各クラスの訓練サンプルの数を減らすか、または分類器は、ほとんどの訓練サンプルがあるクラスに画像を分類する傾向があり得る。

    おそらく、クラス2のトレーニングサンプルをコピーして貼り付けることができますか?

    データ補強のために、訓練サンプルにノイズを追加したり、ガウス雑音を追加したり、画像をトリミングしたりサイズを変更したりすることができます。これにより、モデルはより堅牢になります。

    関連する問題