GridSearchCVのスコアラーの値を取得する方法を理解しようとしています。以下のサンプルコードは、テキストデータに小さなパイプラインを設定します。GridSearchCVスコアリングとgrid_scores_
次に、異なるnグラムにわたってグリッド検索を設定します。
スコアをf1測定を介して行われる:
#setup the pipeline
tfidf_vec = TfidfVectorizer(analyzer='word', min_df=0.05, max_df=0.95)
linearsvc = LinearSVC()
clf = Pipeline([('tfidf_vec', tfidf_vec), ('linearsvc', linearsvc)])
# setup the grid search
parameters = {'tfidf_vec__ngram_range': [(1, 1), (1, 2)]}
gs_clf = GridSearchCV(clf, parameters, n_jobs=-1, scoring='f1')
gs_clf = gs_clf.fit(docs_train, y_train)
今私はスコアを印刷することができる:
gs_clf.grid_scores_
[mean: 0.81548, std: 0.01324, params: {'tfidf_vec__ngram_range': (1, 1)},
mean: 0.82143, std: 0.00538, params: {'tfidf_vec__ngram_range': (1, 2)}]
プリント
印刷gs_clf.grid_scores_ [0] .cv_validation_scores
array([ 0.83234714, 0.8 , 0.81409002])
それはdocumentationから私には明らかではない。
はgs_clf.grid_scores_です[0]、この場合には(倍ごとに、あたりのF1対策をスコアリングパラメータによって定義されたスコアを持つ配列を.cv_validation_scores倍)?そうでなければ、それは何ですか?
Iの代わりに、別のmetricを選択して、そのようなスコア=「f1_micro」、gs_clf.grid_scores_の各配列として[i]は.cv_validation_scoresは、特定のグリッド検索パラメータを選択するための折り畳み用f1_microメトリックを含有するであろうか?
はい、正しく理解しています – maxymoo