をGridSearchCVに渡されたパイプラインの内側から分散を説明する方法を次のようにsklearnは - PCAのコンポーネントを取得し、私はパイプラインでGridSearchCVを使用しています
grid = GridSearchCV(
Pipeline([
('reduce_dim', PCA()),
('classify', RandomForestClassifier(n_jobs = -1))
]),
param_grid=[
{
'reduce_dim__n_components': range(0.7,0.9,0.1),
'classify__n_estimators': range(10,50,5),
'classify__max_features': ['auto', 0.2],
'classify__min_samples_leaf': [40,50,60],
'classify__criterion': ['gini', 'entropy']
}
],
cv=5, scoring='f1')
grid.fit(X,y)
私は今からcomponents
とexplained_variance
のようなPCAの詳細を取得するにはどうすればよいですgrid.best_estimator_
モデル?
また、pickleを使用してファイルにbest_estimator_
を保存して後でロードすることもします。この負荷見積もりからPCAの詳細を取得するにはどうすればよいですか?私はそれが上記と同じだろうと思う。
私はあなたのPCAグリッド得ることはありません一部:今、あなたは、単にこのPCAのこのようなオブジェクトのための
components_
とexplained_variance_
attibutesにアクセスするためにこれを使用することができます '「reduce_dim__n_components」:範囲を(0.7,0.9 、0.1) 'ここにはどのような値の範囲がありますか? – guy