2016-07-17 13 views
-1

私はPythonでデータマイニングを学んでいます。私はクロスバリデーションを試しています。クロスバリデーションを使用して決定されたモデルを使用した外部データの検証

import numpy as np 
from sklearn.cross_validation import KFold 
X = np.array([0.1, 0.2, 0.3, 0.4]) 
Y = np.array([False,True,True,False]) 
kf=KFold(4,n_folds=2) 
for train_index, test_index in kf: 
    X_train, X_test = X[train_index], X[test_index] 
    Y_train, Y_test = Y[train_index], Y[test_index] 

ここで新しいリストがあります。 X=[0.25,0.33,0.21,0.101];Y=[True, False, False, True]上記のコードを使用して決定されたモデルごとに結果を確認するにはどうすればよいですか?

+0

あなたがどのように検証し、する何を意味するかは不明です。 – tripleee

+0

ファインマニュアルを読んでください:http://scikit-learn.org/stable/modules/cross_validation.html – dukebody

答えて

1

KFoldの機能は、モデルの決定とは関係ありません。

データとラベルを折り畳むだけです。

あなたがループに追加する場合:

print(X_train, X_test) 
    print(Y_train, Y_test) 

をあなたは各繰り返しで折り目を見ることができます:

# Iteration 1 
# Train   Test 
    [ 0.3 0.4]  [ 0.1 0.2] 
    [ True False] [False True] 
# Iteration 2 
# Train   Test 
    [ 0.1 0.2]  [ 0.3 0.4] 
    [False True] [ True False] 
関連する問題