2016-12-15 4 views
0

2つのデータセットでそれぞれ200と50ポイントの分類問題があります。これらの40個のデータ点のうちの1つをテストセットとする。私は5つの最近傍を考慮して分類子としてkNNを選択しました。分類中にトレーニングデータをn回コピーするにはどうすればいいですか?

私はクラス1のためのトレーニングデータは16回コピーされ、その結果、クラス1は私がコピーすることができますどのようにクラス0

と同じトレーニングサイズを有するような方法でデータを豊かにする必要があり

n_neighbors = 5 
std = 5 

# generate data 

X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42) 
h = .1 # step size in the mesh 

X1, y1 = make_blobs(n_samples=50, centers=2, n_features=2, cluster_std = std, random_state=42) 

# split into training and test set 
X0_train, X0_test, y0_train, y0_test = train_test_split(X0, y0, test_size=0.2, random_state=42) 

X1_train, X1_test, y1_train, y1_test = train_test_split(X1, y1, test_size=0.2, random_state=42) 

トレーニングデータは16回ですか?私は手がかりを持っていません。まさにここではコピーが何を意味していますか?

誰もが同じことを説明するコードのいくつかの行をスローすることはできますか?

答えて

関連する問題