私は3ヶ月間、約10kの顧客の過去の購入データを持っています。そのデータを使用して、今後3ヶ月以内に購入の予測をしたいと考えています。私は、xgboostに異なるカテゴリー間の個人支出を知りたいので、顧客IDを入力変数として使用しています。調整する方法はありますか?個々の購入に基づいてより多くを学ぶことですまたはこの問題に対処するより良い方法は?xgboostを微調整して変数に重みを割り当てる方法はありますか?
3
A
答えて
1
xgboostに引数weight
を渡すことができるウェイトベクトルを使用できます。サイズがnrow(trainingData)
に等しいベクトルです。しかし、これは一般的に、間違いを分類ミスにペナルティをかけるために使用されます(売り上げが1か月に1回しか言及していない稀少データを考えます;販売を学びたい場合は、販売インスタンスに重点を置く必要があります。ゼロ)。どうやら理解できない独立変数の体重をtweak
にしようとしています。
従属変数の振る舞い(あなたのケースでの販売)を学ぶことは、機械学習モデルが何をするのかを学ぶことです。あなたはそれを微調整して強制的にいくつかの機能から学ぶべきではありません。購入行動を学習するために、監督されていない技術のクラスタリングタイプがより有用であろう。
ユーザー固有の動作を含めるには、クラスタリングを行い、各ユーザーの索引がない索引および索引索引のあるカテゴリを特定します。次に、これらのフラグを使用していくつかのカテゴリの機能を作成できます。
PS:問題を説明するデータの中には、他の人があなたをより良くするのに役立つものがあります。
関連する問題
- 1. XGBoostを微調整して特定の予測変数の列に多くの重みを与える方法
- 2. 整数をポインタデータに割り当てる方法は?
- 3. あるタートルの変数を別のタートルの変数に割り当てる方法はありますか?
- 4. DB変数をPHP変数に割り当てる方法は?
- 5. 名前に文字列を渡して変数に値を割り当てる方法はありますか?
- 6. shared_ptrに割り当てる方法はありますか?
- 7. rのニューラルネットパッケージの開始重みを割り当てる方法
- 8. オブジェクト関数を変数に割り当てる方法は?
- 9. sasの変数に列数を割り当てる方法は?
- 10. 変数を最初に割り当ててからフリーズする方法はありますか?
- 11. スマート変数にjavascript変数を割り当てる方法
- 12. 2または+変数を割り当てる方法
- 13. フォーム内のすべてのテキストボックスを1つの変数に割り当てる方法はありますか?
- 14. 辞書からグローバル変数を割り当てる方法は?
- 15. バッチで複数の変数を割り当てるより効果的な方法はありますか?
- 16. ポスト値をグローバル変数として割り当てる方法
- 17. リストから整数を選択してPythonで割り当てる方法
- 18. SQLストアドプロシージャの変数に値を割り当てる方法は?
- 19. 変数に%%パラメータを割り当てる方法は?
- 20. メンバー変数を一時的に割り当てる方法は?
- 21. 要求パラメータにint変数を割り当てる方法は?
- 22. 出力をシェルスクリプト変数に割り当てる方法は?
- 23. 配列のオブジェクトに変数を割り当てる方法は?
- 24. .NETでグローバル変数にメモリを割り当てる方法は?
- 25. Vue.jsで変数にjson値を割り当てる方法は?
- 26. Uint32変数に値を割り当てる方法は?
- 27. 列の値を変数に割り当てる方法は?
- 28. TensorFlow変数に値を割り当てる方法は?
- 29. 文字列変数をdatableに割り当てる方法は?
- 30. onclickをキャンバス内の変数に割り当てる方法は?
私は要求が個人ではなく機能に重みを付けることであると考えます。つまり、購入数や単純な製品所持などの他の変数の代わりに量に関連する変数をモデルに簡単に含めることを保証します。 –
上記のEricが述べたように、目的はユーザーにいくつかの重みを与えて、xgboostの機能が学習し、ユーザーのグループ全体の一般化された傾向ではなく、個々の傾向を示すということです。 – muni
はい..私は両方の質問に答えようとしました...レコード上で可能な重み付けは可能ですが、フィーチャ...ではなく、フィーチャの一部の重み付けは、モデルをあまり強力にしません。あなたが木の最初の破損点を知っていれば(ほとんどのインパクト1);それによってデータを分割して学習することができます。ツリーはCARTなどの単一ツリーの高分散を除去するために存在します。変数は高分散を誘導します..縮退を行うことはできません。ここでは木はスケールに依存しないからです。私はそのような方法のインパクトを考えるのではなく、サンプルデータを置くことに役立ちます。 – abhiieor