2017-01-30 21 views
0

xgboostのクロス検証を実行していますカーブの下の領域を取得します< 0.5。xgboost.cvは0.5未満の曲線の下の領域を返します

私は

best_params_grid_search={'base_score': 0.5, 
'colsample_bylevel': 1, 
'colsample_bytree': 0.8, 
'gamma': 0, 
'learning_rate': 0.3, 
'max_delta_step': 0, 
'max_depth': 3, 
'min_child_weight': 3, 
'missing': nan, 
'n_estimators': 15, 
'objective': 'binary:logistic', 
'reg_alpha': 0, 
'reg_lambda': 1, 
'scale_pos_weight': 1, 
'seed': 5, 
'silent': 1, 
'subsample': 0.8} 

skf_inner = StratifiedKFold(n_splits=n_fold_inner,random_state=5, shuffle=True) 

dtrain = xgb.DMatrix(X_train, label=y_train, missing = np.nan) 

num_rounds = 20 
cv_xgb4 = xgb.cv(best_params_grid_search, 
dtrain,num_boost_round =num_rounds,folds=skf_inner,metrics={'auc'},seed=5) 

に従うが、私はAUC < 0.5を得るようxgboost.cvを実行しています。この結果をどのように解釈すべきですか?

test-auc-mean test-auc-std train-auc-mean train-auc-std 
0  0.402675  0.088828  0.777729  0.058559 
1  0.390638  0.124389  0.890424  0.044356 
2  0.418827  0.068236  0.932992  0.031358 
3  0.448971  0.073219  0.946747  0.011304 
4  0.460597  0.118598  0.956311  0.008302 
5  0.437963  0.057661  0.970979  0.005968 
6  0.461831  0.095017  0.978789  0.010346 
7  0.422428  0.111894  0.977095  0.014329 
8  0.419650  0.117329  0.983260  0.011606 
9  0.433745  0.106113  0.989522  0.008979 
10  0.440947  0.097941  0.992227  0.009497 
11  0.449588  0.071629  0.994396  0.006438 
12  0.429218  0.061360  0.995858  0.004400 
13  0.455144  0.064862  0.998051  0.002757 
14  0.443416  0.057515  0.999513  0.000689 
15  0.440535  0.079628  0.999513  0.000689 
16  0.446296  0.077557  1.000000  0.000000 
17  0.450000  0.074674  1.000000  0.000000 
18  0.468107  0.092640  1.000000  0.000000 
19  0.451029  0.096165  1.000000  0.000000 

データはここdownoladedすることができます。

https://drive.google.com/file/d/0B3vXKJ_zYaCJQmxWX1AtTjdoYWc/view?usp=sharing

は、事前にありがとうございます。それはあなたの分類器は、情報価値の分類器(ランダムセレクタ).Proof、その後悪化し動作すること、それが意味するので、AUC < 50を持っている非正規だすべての

答えて

関連する問題