2017-10-09 4 views
0

xgboost4jパッケージでjavaでDMatrixを作成する場合、最初は "filepath"を使って行列を作成することに成功します。Java - xgboost DMatrix入力

​​

しかし、私はモデルを訓練しよう:

Booster booster = XGBoost.train(trainMat, params, round, watches, null, null); 

私は次のエラーを取得する:

...regression_obj.cc:108: label must be in [0,1] for logistic regression 

今、私のデータは固体です。私はPythonで構築されたxgbモデルでそれをチェックしました。 私は問題がデータフォーマットに何らかの形であると推測しています。次のように 現在、形式は次のとおりです。

X1-X5は「実」の数字とyは
x1,x2,x3,x4,x5,y 

は0または1ファイルの終わりです.CSV

たぶんセパレータは「あってはなりません、 '?

答えて

0

DMatrixは.libsvmファイルを取得します。 Pythonで簡単に作成できます。

target 0:column1 1:column2 2:column3 ...ので、他のすべての列(予測値)がで率を高めるに添付されている間、そのターゲットは、最初の列である「:」で

LIBSVMは次のようになりますの間に。

+0

これを考えると、データを保存するこの方法は、疎なデータでうまくいくでしょう。その列のデータ値がNAまたは0(増加指数)の場合は、単に書き込まないでください。 –