以下私はcsvファイルを読み込んで、700
のランダムサンプルをファイルから取得するコードを持っています。 私は複数のファイルでこれを行う必要がありますが、ファイルを反復処理すると、ランダムに生成されたサンプルはランダムに生成されたものと同じに保たれます。Python Pandasで一貫したランダムサンプルを使用するには?
df = pd.read_csv(file.csv, delim_whitespace=True)
df_s = df.sample(n=700)
私の考えは、行番号を取得して次のファイルに渡すことです。しかし、これはあまりエレガントではないようです。
この問題の解決策をご存知ですか? 750
望ましい結果の例
df1 = pd.read_csv(file1.csv, delim_whitespace=True)
df_s1 = df1.sample(n=700) # choose random sample
df2 = pd.read_csv(file2.csv, delim_whitespace=True)
df_s2 = df2.sample(n=700) # use same random sample as above
同じ形状ですか? – ayhan
それらはすべて同じ数の列を持ちますが、行は異なります – Newskooler