不均衡なトレーニングデータでCNNやRNNをトレーニングしている間に、トレーニングが比較的速く収束することがわかりました。 80%のyesの例があり、おそらく常にyesを出力します)。私は、この解決策は局所最適であり、ネットワークは訓練中にそれをエスケープできないと説明することができます。これは正しかったのでしょうか? 私はそれに対して何ができますか?セットをより均等にするために、より多くのトレーニングデータを合成しますか?ほかに何か? ありがとう!機械学習の不均衡なトレーニングデータ(CNNs/RNNs)
1
A
答えて
1
はい、あなたは正しいです。不均衡な訓練データは精度に影響します。不均衡なクラスの問題を解決する解決策のいくつかは以下の通りです。
1)その他のデータ収集:これは場合によっては容易ではありません。たとえば、非詐欺行為に比べて詐欺行為の件数は非常に少ない。
2)アンダーサンプリング:多数クラスからデータを削除します。あなたはそれを無作為にまたは有益に削除することができます(配布物の助けを借りて、取り除くべき部分/パッチを決める)
3)オーバーサンプリング:少数派クラスに属する観察を複製する。
1
あなたの質問はTFとは関係がありません。これは機械学習の標準的な問題です。ちょうどGoogleの "機械学習の不均衡なデータを扱う"とタイプし、いくつかのページを読んでください。ここで
は、いくつかのアプローチです:
- は
- 使用他のメトリック(F1)
- アンダー/オーバーサンプリング/重み付け
関連する問題
- 1. 機械学習の歪みクラスと不均衡クラス
- 2. 機械学習で不均衡なデータをモデル化する方法は?
- 3. 機械学習、不均衡な数値以外の変数クラスの問題があります
- 4. 機械学習、Python
- 5. 機械学習システム
- 6. 機械学習udacity
- 7. Python - 機械学習
- 8. 機械学習モデルテスト
- 9. 深い学習と機械学習
- 10. 機械学習のヌルクラス
- 11. ロボットでの機械学習
- 12. 機械学習のJavaライブラリ
- 13. 機械学習データのフォーマット
- 14. GATEの機械学習
- 15. 機械学習の提案
- 16. C#の機械学習ライブラリ
- 17. Azureの機械学習 - データセット
- 18. 深い学習の不均衡なデータの悪影響はありますか?
- 19. 機械学習 - 分類アルゴリズム
- 20. Coursera機械学習:グラデーションデサントベクトル化
- 21. 機械学習Webサービス
- 22. aws機械学習エンドポイント
- 23. 機械学習分類アンサンブル
- 24. 反復機械学習アルゴリズム
- 25. 機械学習用レンタルサーバー
- 26. AWS機械学習エラーS3
- 27. R機械学習モデル - ブラインドテスト
- 28. テキストマイニングと機械学習
- 29. 機械学習分類データセット
- 30. 転送学習は、不均衡なデータセットの問題を解決しますか?