-1
imagenet、cifar-100などの一般的なデータセットでは、各カテゴリの画像数が同じであることがわかりました。 分類のためのトレーニング画像が不均衡である場合、悪影響があるのだろうかと思います。 (例えばヒョウの場合は100、象の場合は5000)深い学習の不均衡なデータの悪影響はありますか?
imagenet、cifar-100などの一般的なデータセットでは、各カテゴリの画像数が同じであることがわかりました。 分類のためのトレーニング画像が不均衡である場合、悪影響があるのだろうかと思います。 (例えばヒョウの場合は100、象の場合は5000)深い学習の不均衡なデータの悪影響はありますか?
この場合、いくつかの問題が生じる可能性があります。隠されたレイヤーはゾウの特徴に向かってより鍛えられます。ヒョウを収容するために隠れたフィルターやニューロンの数を増やすと、プロセス中のゾウにあまりにもフィットするリスクがあります。
主な問題は、残りの入力と区別できる十分なヒョウの画像があるかどうかです。もしそうなら、ヒョウが訓練された最初の200~300枚の写真で良いバランスを取るように訓練データをロードすれば、後者のゾウの訓練は "発見された"フィーチャにあまり影響を与えません。しかし、これは正確さよりも訓練のスピードに影響します。