2017-11-06 19 views

答えて

0

使用sklearn.model_selection.train_test_splitにそれを変換する方法を理解することができオクターブ

X_tr = D_tr(:, 1:end-1); 
y_tr = D_tr(:, end); 
X_ts = D_ts(:, 1:end-1); 
y_ts = D_ts(:, end); 

のコードではなく、を持っている:

from sklearn.model_selection import train_test_split 

X_train, X_test, y_train, y_test = \ 
    train_test_split(X, y, test_size=0.33, random_state=42) 

デモ:水平(データセットを分割する方法)np.splitを使用して:

In [68]: TR = np.random.randint(10, size=(5,5)) 

In [69]: TR 
Out[69]: 
array([[2, 9, 9, 0, 3], 
     [5, 5, 6, 0, 3], 
     [7, 1, 6, 1, 0], 
     [5, 0, 2, 0, 4], 
     [2, 5, 9, 4, 2]]) 

In [70]: X_tr, y_tr = np.split(TR, [-1], axis=1) 

In [71]: X_tr 
Out[71]: 
array([[2, 9, 9, 0], 
     [5, 5, 6, 0], 
     [7, 1, 6, 1], 
     [5, 0, 2, 0], 
     [2, 5, 9, 4]]) 

In [72]: y_tr 
Out[72]: 
array([[3], 
     [3], 
     [0], 
     [4], 
     [2]]) 

PSテストデータセットの分割には同じテクニックが使用されます

+0

これは、1つのcsvファイルしか指定されない場合、または1つのデータセットしか読み込まない場合に分割されます。しかしここには2つの別々のcsvファイルがあります。一つはトレーニング用、もうひとつはテスト用です。 – Mia

+0

@ManikaMaheshwari、更新された回答の小さなデモをご覧ください – MaxU

関連する問題