2016-12-27 22 views
3

私はさまざまな記事を調べましたが、そのほとんどは特定の行ではなく特定の行に重みを導入する方法を説明しました。 RのGBMでは、ある特定の特徴から他のものよりも優秀に学習するモデルを割り当てることができる。 PythonのXGBoostのようなことはできますか?XGBoostを微調整して特定の予測変数の列に多くの重みを与える方法

私は、次を経て: here 1here 2here 3、すべてが何らかの形で我々が行に重みを与えることができます言及します。

私はXGBoostを初めて使用しています。変数に重みを割り当てることができるかどうかを確認するには2番目の確認が必要です。

状況は、スケジュールされた列と実際の目標があります。スケジューリングされたスケジュールが5〜10kになると、私のモデルは膨大なマージンで予測されます。スケジューリングされた> 10kの場合、私のエラーメトリックは20-30%の範囲にありますが、平均70%(平均絶対誤差)でオフになっています。私はXGBoostにScheduledで訓練を強制することができますか?

私はバケット変数、フラグ変数を導入しようとしましたが、それは最も重要な機能ではないことが分かりました。

また、このシナリオをどのようにタックするかについてのご意見は、本当に役に立ちます。

XGBoostに重み(sample_weight)を割り当てる方法が存在する場合、パラメータ(weight_data)はどのように見えるか。その形状とすべて、

ありがとう

答えて

1

私はまた、同様の問題の解決策を探しています。残念なことに、樹木は数レベル(バイナリ、カテゴリなど)のものに比べて数値変数に偏っています。その理由は、個々の木の学習の貪欲さです。分散が大きいフィーチャを使用すると、より良い分割を見つける機会が増えます。これは文献でも議論されている。

関連する問題