10,000個の観測値と50個のフィーチャと1個のラベルを持つデータセットが与えられた場合、X_train、y_train、X_test、およびy_testの次元はどのくらいでしょうか?75%/ 25%の列車/テスト分割を仮定しますか?それは、第二の1Pythonマシンでラベルと機能を学習する
X_train:(2500, 50)
y_train: (2500,)
X_test: (7500, 50)
y_test: (7500,)
または
X_train: (7500, 50)
y_train: (7500,)
X_test: (2500, 50)
y_test: (2500,)