2016-05-26 9 views
0

XGBoostは、テストデータセットの予測のリストを生成します。私の質問は、どのように実際のテストファイルの行に生成された予測をマップすることができますか? n番目の予測がn番目のデータ行に対応すると仮定するのは厳密に安全ですか? XGBoostは、その操作にマルチスレッドを活用します。したがって、そのような設定では、予測結果がテストデータ行に厳密にマッピングされることが信頼できるのですか?理想的には、テストデータファイルの一部の行識別子を使用して予測に注釈を付ける方法があれば、本当に好きだろうか?XGBoost予測を対応するデータ行にマップするにはどうすればよいですか?

私はこの例を使用していて、XGBostのDMatrixデータ形式で作業しています。 https://github.com/dmlc/xgboost/tree/master/demo/binary_classification

答えて

0

厳密に安全なの場合は、私の経験に基づいて、その仮定が働きます。また、xgboostを使用しているほとんどのコードスニペットでは、私はKaggleコンテストlike this oneを見てきましたが、人々はこれと同じ仮定をしています。要するに、あなたは安心して動作することができますが、私はドキュメントを掘り下げていないので、いつも動作するとは言いません。

関連する問題