2017-11-23 11 views
0

私はサイズがN =~ (3Million,79)のデータフレームを持っています。私は、それぞれが前に説明したデータフレームのランダムなサブセットであるサイズ3000の1kデータフレームを作成する必要があります。さらに、それは交換することなくです。そうすれば、データの全体が得られますが、ランダムに1kのデータフレームに分割されます。非常に大きなデータフレームをm個のランダムなn個のデータフレームに分割する -

+0

https://stackoverflow.com/questions/38250710/how-to-split-data-into- 3セットの列車検証および試験 – Wen

+0

あなたの特定の質問は何ですか? –

+0

申し訳ありませんが、私は間違いなく編集を完了していません。 @Wen、nはaprox 10kだから、その質問は役に立ちません、すでに試してみましたが、ありがとう –

答えて

2

あなたがあなたのデータフレームを分割したいnどのように多くの部分で決めたら、あなただけ行うことができます

import pandas as pd 
import numpy as np 

dfs = np.array_split(df.sample(frac=1), n) 
+1

正確に私が必要なもの!ありがとう! –

関連する問題