0
私は12行×5列のデータフレーム(df)を持っています。各ラベルから1行をサンプリングし、3行×5列の新しいデータフレーム(df1)を作成します。次にdfから行をサンプリングする次回は、すでにdf1にあるものと同じものを選択しません。だから、すでにサンプリングされた行をdfから削除するにはどうしたらいいですか?データフレームのランダムにサンプリングされた行を削除して再度サンプリングするのを避けるには?
import pandas as pd
import numpy as np
# 12x5
df = pd.DataFrame(np.random.rand(12, 5))
label=np.array([1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3])
df['label'] = label
#3x5
df1 = pd.concat(g.sample(1) for idx, g in df.groupby('label'))
#My attempt. It should be a 9x5 dataframe
df2 = pd.concat(f.drop(idx) for idx, f in df1.groupby('label'))
DF
DF1
DF2