-1
pipe = Pipeline([('reduce_dim', LinearDiscriminantAnalysis()),('classify', LogisticRegression())])
param_grid = [{'classify__penalty': ['l1', 'l2'],
'classify__C': [0.05,0.1, 0.3, 0.6, 0.8, 1.0]}]
gs = GridSearchCV(pipe, param_grid=param_grid, cv=5, scoring='roc_auc', n_jobs=3)
gs.fit(data, label)
パイプラインとgridsearchcvの使用に関する質問があります。今私は最初に次元を減らすためにldaを使用しようとすると、私はパイプラインとgridsearchcvについてのプロセスを知りたいですか? split train/test-> lda-> fit &予測またはlda-> split train/test-> fit &予測するか?パイプライン付きsklearn lda gridsearchcv
第1の選択肢は現実世界のシナリオで実行可能です。 2番目に、LDAはテストデータからの情報漏洩を持つためです。とにかくこの質問は、プログラミングについてのことではなく、方法論の詳細なので、[Cross-validated](https://stats.stackexchange.com) –
に適しています。@seraのコメントの後に、 gridSearchCVの動作順序、またはタスクに適した順序を知りたいかどうかを指定します。 –