深い学習の不均衡なデータの悪影響はありますか？

-1

imagenet、cifar-100などの一般的なデータセットでは、各カテゴリの画像数が同じであることがわかりました。分類のためのトレーニング画像が不均衡である場合、悪影響があるのだろうかと思います。（例えばヒョウの場合は100、象の場合は5000）深い学習の不均衡なデータの悪影響はありますか？

出典

2016-06-27 Zhenyu Wu

この場合、いくつかの問題が生じる可能性があります。隠されたレイヤーはゾウの特徴に向かってより鍛えられます。ヒョウを収容するために隠れたフィルターやニューロンの数を増やすと、プロセス中のゾウにあまりにもフィットするリスクがあります。

主な問題は、残りの入力と区別できる十分なヒョウの画像があるかどうかです。もしそうなら、ヒョウが訓練された最初の200~300枚の写真で良いバランスを取るように訓練データをロードすれば、後者のゾウの訓練は "発見された"フィーチャにあまり影響を与えません。しかし、これは正確さよりも訓練のスピードに影響します。

出典

2016-06-27 21:46:08 Prune

深い学習の不均衡なデータの悪影響はありますか？

答えて

関連する問題