分類中にトレーニングデータをn回コピーするにはどうすればいいですか？

2つのデータセットでそれぞれ200と50ポイントの分類問題があります。これらの40個のデータ点のうちの1つをテストセットとする。私は5つの最近傍を考慮して分類子としてkNNを選択しました。分類中にトレーニングデータをn回コピーするにはどうすればいいですか？

私はクラス1のためのトレーニングデータは16回コピーされ、その結果、クラス1は私がコピーすることができますどのようにクラス0

と同じトレーニングサイズを有するような方法でデータを豊かにする必要があり

n_neighbors = 5 
std = 5 

# generate data 

X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42) 
h = .1 # step size in the mesh 

X1, y1 = make_blobs(n_samples=50, centers=2, n_features=2, cluster_std = std, random_state=42) 

# split into training and test set 
X0_train, X0_test, y0_train, y0_test = train_test_split(X0, y0, test_size=0.2, random_state=42) 

X1_train, X1_test, y1_train, y1_test = train_test_split(X1, y1, test_size=0.2, random_state=42)

トレーニングデータは16回ですか？私は手がかりを持っていません。まさにここではコピーが何を意味していますか？

誰もが同じことを説明するコードのいくつかの行をスローすることはできますか？

出典

2016-12-15 Rishik Mani

私はあなたがこの問題から克服するINORDER、クラス不均衡問題について話している、あなたがサンプリングを行う必要があることを推測する（アップまたはダウンサンプリングのいずれか）、以下の技術が:(https://www.cs.cmu.edu/afs/cs/project/jair/pub/volume16/chawla02a-html/chawla2002.htmlを助けることができるかどうかを確認してください）

出典

2016-12-16 05:01:14 MargS

分類中にトレーニングデータをn回コピーするにはどうすればいいですか？

答えて

関連する問題