私のデータセットは、90%の陰性サンプルと10%の陽性サンプルを持ち、非常に不均衡です。私はscale_pos_weightのパラメータを使用して9に設定しようとしています。このparamのメカニズムは何ですか。私はそれが実際に何を意味するのか興味があります:それは陽性サンプルを9回繰り返すことを意味しますか?あるいは、毎回ネガティブサンプルの1/9サンプルを取り出し、何度もモデルをトレーニングします。さらに、負のサンプルが正のサンプルより少しだけ大きいデータセットを持っている場合、パラメータを再度指定する必要がありますか?xgboostでparam 'scale_pos_weight'を使用する仕組みは何ですか?
6
A
答えて
0
私は、このパラメータが何をしているかを明示的に述べているドキュメントのどこにも見たことがありません。しかし、私はそれが後者であることを確信しています。すなわち、それはネガティブサンプルの1/9に基づいてツリーを構築します。データが良好であれば、ほぼ同じ効果が得られるはずですが、ネガのサブセットを取ることはモデリングのためのコンベンションです。なぜなら、互いに確認できる9つのトレーニングセットがあるからです。
私は90/10スプリットがあまりにも不均衡であるとは必ずしも思いません。それは多くの状況で得られるよりもはるかに優れており、再調整が常に役立つかどうかについてはdebateがあります。
関連する問題
- 1. SQLでprocedure.iniとは何ですか、また.iniの仕組みは?
- 2. 組み込みシステムで使用するサーバー側のWebテクノロジは何ですか?
- 3. 全体の仕組みはどうですか?
- 4. 組み込みシステム(Cコード)で使用されるtdfファイルは何ですか?
- 5. 組み込み配列には何を使用しますか?
- 6. XGBoost:パラメータ 'objective'は何ですか?
- 7. PythonでXGBoostのtree_method paramを指定する
- 8. Javaでの同期の仕組みは?
- 9. asp.netバンドルの仕組みは内部で
- 10. Airflowでの展開の仕組みは?
- 11. Vert.xでの将来の仕組みは?
- 12. JavaでのJMSの仕組みは?
- 13. asp.netでのセッションの仕組みは?
- 14. jsでの参照の仕組みは?
- 15. StringBufferでの同期の仕組みは?
- 16. Database.Migrate()メソッドの仕組みは?データベースをダウングレードできますか?
- 17. conduit.comの仕組みは誰にでも分かりますか?
- 18. SOAP Webサービスの仕組みとPHPでの使用方法
- 19. SHA-RSAの仕組みは?
- 20. コード/イオンの仕組みは?
- 21. NSValueTransformerの仕組みは?
- 22. XML GUIDの仕組みは?
- 23. SPAの仕組みは?
- 24. CreateEntity PDUの仕組みは?
- 25. MonoTouchの仕組みは?
- 26. GWTファイルアップロードの仕組みは?
- 27. sequelizeの仕組みは?
- 28. PARTITIONED BYの仕組みは?
- 29. Nativescriptの仕組みは?
- 30. libGDXレンダリングメソッドの仕組みは?
正しい説明はhttps://github.com/dmlc/xgboost/issues/2428です。 –