1
私はクラスタを与える列を持つデータフレームを持っています。列車で同じ割合でkfoldを実行し、すべてのクラスタでテストしたいと思います。列の各値内でパンダデータフレームをサブサンプルする方法
私は次のコードでそれを自分で行うことができます知っている:
nb_fold = 10
for i in range(nb_fold):
X_train= X.groupby('Cluster').apply(lambda x: x.sample(frac = 1/nb_fold))
X_train.index = temp.index.droplevel(0)
Y_train = Y.loc[X_train.index]
X_eval, Y_eval = X.drop(X_train.index), Y.drop(Y_train.index)
しかし、私はscikitがあった場合、これは交換に引き分けをしているので、そのためにラッパーを学び、私は交換せずに引き分けを使用することができます不思議に思いました。
これはまさに私が必要としていたものです。ありがとうございました! – ysearka