2017-03-17 5 views
2

ランダムな検索とグループ化されたk倍のクロスバリデーションジェネレータを使用して、sklearnのパラメータに対するグリッド検索を実装しようとしています。以下の作品:sklearn grid search withグループ化K fold cv generator

skf=StratifiedKFold(n_splits=5,shuffle=True,random_state=0) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=skf,n_iter=10) 
rs.fit(X,y) 

これは私がgroupsパラメータを示すにはどうすればよい

gkf=GroupKFold(n_splits=5) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
rs.fit(X,y) 

#ValueError: The groups parameter should not be None 

ではないでしょうか?

いずれも参考として本

gkf=GroupKFold(n_splits=5) 
fv = gkf.split(X, y, groups=groups) 
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
rs.fit(X,y) 

#TypeError: object of type 'generator' has no len() 

答えて

2

を行うが、これは

rs=sklearn.model_selection.RandomizedSearchCV(forest,parameters,scoring='roc_auc',cv=gkf,n_iter=10) 
ため

rs.fit(X,y,groups=groups) 

を介して行われ

関連する問題