0
from sklearn.ensemble import AdaBoostClassifier, BaggingClassifier, RandomForestClassifier
import numpy as np
import random
from sklearn.svm import SVC
X=np.random.rand(1000,2)
Y=[random.randint(0,1) for x in range(0,1000)]
svm=BaggingClassifier(SVC(kernel='rbf', random_state=123, gamma=.000001, C=100000, class_weight='balanced'), max_samples=1/5.0, n_estimators=5, n_jobs=-1,random_state=123)
classfier=svm.fit(X,Y)
print(len(svm.estimators_samples_))
print(len(svm.estimators_samples_[0]))# here I expect 0.05*400 samples. but the result is 1000.
このコードでは、SVMでBaggingClassifierを適用しようとしています。通常、sckitlearnのドキュメントで説明されているように、max_samples
は、各見積もりに使用するサンプルの最大数を修正します。しかし、私は各推定器(n_estimators = 5)がすべてのデータセットを取ることを述べている。バグですか?BaggingClassifierは毎回すべてのデータセットを取ります