0
2つのデータセットでそれぞれ200と50ポイントの分類問題があります。これらの40個のデータ点のうちの1つをテストセットとする。私は5つの最近傍を考慮して分類子としてkNNを選択しました。分類中にトレーニングデータをn回コピーするにはどうすればいいですか?
私はクラス1のためのトレーニングデータは16回コピーされ、その結果、クラス1は私がコピーすることができますどのようにクラス0と同じトレーニングサイズを有するような方法でデータを豊かにする必要があり
n_neighbors = 5
std = 5
# generate data
X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42)
h = .1 # step size in the mesh
X1, y1 = make_blobs(n_samples=50, centers=2, n_features=2, cluster_std = std, random_state=42)
# split into training and test set
X0_train, X0_test, y0_train, y0_test = train_test_split(X0, y0, test_size=0.2, random_state=42)
X1_train, X1_test, y1_train, y1_test = train_test_split(X1, y1, test_size=0.2, random_state=42)
トレーニングデータは16回ですか?私は手がかりを持っていません。まさにここではコピーが何を意味していますか?
誰もが同じことを説明するコードのいくつかの行をスローすることはできますか?