回帰問題にxgboost
を使用していますが、これは出力の販売であり、それはクラスで、最初は数値ですが、私はそれxgboost使うと、エラーを示していますが、私がしたい数値形式で出力のみxgboostエラー - 私のラベルがすでに数字であり、0、1の範囲にない数字で結果が必要な場合、ラベルは[0,1]にする必要があります。
labels <- train$Item_Outlet_Sales# train label
ts_label <- test$Item_Outlet_Sales # test label
# converted into matrix (one hot encoding)
new_tr <- model.matrix(~.+0,data = train[,-c("Item_Outlet_Sales"),with=F])
new_ts <- model.matrix(~.+0,data = test[,-c("Item_Outlet_Sales"),with=F])
## checking class
class(labels)
[1] "numeric"
私は test$Item_Outlet_Sales <- NA
class(test$Item_Outlet_Sales)
[1] "logical"
# coverting `ts_label` into numeric as it initially is logical
ts_label <- as.numeric(ts_label)-1
class(ts_label)
[1] "numeric"
としてテストにラベルまたは応答変数を作成しました
今
dtrain1 <- xgb.DMatrix(data = new_tr,label = labels)
dtest1 <- xgb.DMatrix(data = new_ts,label= ts_label)
xgbmodel1 = xgb.train(data=dtrain1, nround=150, max_depth=5, eta=0.1, subsample=0.9,
objective="reg:logistic", booster="gbtree", eval_metric="rmse")
エラー -
Error in xgb.iter.update(bst$handle, dtrain, iteration - 1, obj) :
[14:08:41] amalgamation/../src/objective/regression_obj.cc:108:
label must be in [0,1] for logistic regression
私は、この使用:私はへの応答変数のすべての値が等しくなっ-1と私のRMSEスコアは無限である
xgbmodel1 = xgb.train(data=dtrain1, nround=150, max_depth=5, eta=0.1, subsample=0.9,
objective="reg:linear", booster="gbtree", eval_metric="rmse")
を..
xgboost
の実装方法を教えてください。この場合、デフォルトの条件でも効果的ですエラーが発生します。
このデータセットには4つのカテゴリ変数があります。ここ
は列車のデータセットのサブセットである確認、R < - 電車[1:3、]
R
Item_Identifier Item_Fat_Content ITEM_TYPE Item_MRP Outlet_Identifier 1:FDA15低脂肪の乳製品249.8092 OUT049 2:DRC01レギュラーソフトドリンク48.2692 OUT018 3:FDN15低脂肪肉141.6180 OUT049 アウトレット_施設アウトレット_アウトレット_タイプ1:1999ティア1スーパーマーケットタイプ1 3735.1380 2:2009ティア3スーパーマーケットタイプ2 443.4228 3:1999ティア1スーパーマーケットタイプ1 2097.2700 Item_Weight Item_Visibility Outlet_Size 1:9.30 0.01604730 2 2:5.92 0.01927822 2 3:17.50 0.01676007 2
私はバイナリターゲットを持っていません。回帰の問題があり、それぞれのアイテムの合計売上高を教えなければなりませんが、これは初めてxgboostを適用して精度を上げることです。どのように回帰の実装に変更を加えるかについて教えてください。 –
これは実習上の問題であり、評価に使用されるメトリックはrmseなので、それに合わせて設定したいので、パラメータチューニングの効果を知ることができます –
「ラベル」変数が論理的でTRUE偽です。私はそれがどのように回帰のために使用されるのか分かりません。 –