0
私はデータとラベルと呼ばれる2つのpython np.arraysを持っています。ランダムにサイズを小さくしたいそうするために、私は次のことをしています:ランダムなインデックスを選んで配列を分割するpython
np.random.seed(0)
ind = np.random.randint(len(data), size=(50000,))
reduced_data = data[ind, :]
reduced_labels = labels[ind]
私はラベルとデータの両方から無作為に50000を選びます。どうすれば残りのデータを保存できますか?最初の配列から残りのインデックスを見つけることができますか?
mask = np.ones(len(data), dtype=bool)
mask[ind] = False
reduced_data = data[~mask] #completely similar to data[ind]
rest_data = data[mask]
したい場合は:あなたは「ランダム」サイズを小さくしたい場合
マスクのサイズはどのようにして決められますか? –
'ind'を指定する方法では、この場合はすでに50000と定義されています。それは完全に真実ではありません、繰り返しが含まれていないので...反復せずに減らしたい場合は、少し考えてください。 – Uvar
ok coolしかしまだ私は種子を使用していますか? –