0
トレーニングとテストの2つのデータセットがある場合、トレーニングデータセットをxtrainとytrainに分け、xtestとytestにテストしたいと思います。私は、PythonPython:2データセットのデータセットを分割する
トレーニングとテストの2つのデータセットがある場合、トレーニングデータセットをxtrainとytrainに分け、xtestとytestにテストしたいと思います。私は、PythonPython:2データセットのデータセットを分割する
使用sklearn.model_selection.train_test_splitにそれを変換する方法を理解することができオクターブ
X_tr = D_tr(:, 1:end-1);
y_tr = D_tr(:, end);
X_ts = D_ts(:, 1:end-1);
y_ts = D_ts(:, end);
のコードではなく、を持っている:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = \
train_test_split(X, y, test_size=0.33, random_state=42)
デモ:水平(データセットを分割する方法)np.split
を使用して:
In [68]: TR = np.random.randint(10, size=(5,5))
In [69]: TR
Out[69]:
array([[2, 9, 9, 0, 3],
[5, 5, 6, 0, 3],
[7, 1, 6, 1, 0],
[5, 0, 2, 0, 4],
[2, 5, 9, 4, 2]])
In [70]: X_tr, y_tr = np.split(TR, [-1], axis=1)
In [71]: X_tr
Out[71]:
array([[2, 9, 9, 0],
[5, 5, 6, 0],
[7, 1, 6, 1],
[5, 0, 2, 0],
[2, 5, 9, 4]])
In [72]: y_tr
Out[72]:
array([[3],
[3],
[0],
[4],
[2]])
PSテストデータセットの分割には同じテクニックが使用されます
これは、1つのcsvファイルしか指定されない場合、または1つのデータセットしか読み込まない場合に分割されます。しかしここには2つの別々のcsvファイルがあります。一つはトレーニング用、もうひとつはテスト用です。 – Mia
@ManikaMaheshwari、更新された回答の小さなデモをご覧ください – MaxU