-1
私はPythonとMachine Learningの新機能です。私は581012レコードと54列を含むデータセットを得ました。私はデータを分割しようとしています20 20 80%トレーニングと20%テスト。私はCrossSearchCVを使って相互検証を行い、最良のパラメータを見つける。データが大きすぎるので、私はアプリケーションを1日以上実行しますが、結果を得ることはできません。私は、分類子が許すトレーニングセットの最大サイズが何であるかを知る方法はないと考えていますか?以下は私の実行コードですクラシファイアが許可するトレーニングセットの最大サイズを見つけるにはどうすればよいですか?
parameters = {'max_depth' :range(1,21)}
print parameters
clf = GridSearchCV(tree.DecisionTreeClassifier(), parameters, cv=10, n_jobs=-1)
clf.fit(X,y)
tree_model = clf.best_estimator_
import pickle
s = pickle.dumps(tree_model)
print(clf.best_score_, clf.best_params_)