0
私はサイズがN =~ (3Million,79)
のデータフレームを持っています。私は、それぞれが前に説明したデータフレームのランダムなサブセットであるサイズ3000の1kデータフレームを作成する必要があります。さらに、それは交換することなくです。そうすれば、データの全体が得られますが、ランダムに1kのデータフレームに分割されます。非常に大きなデータフレームをm個のランダムなn個のデータフレームに分割する -
私はサイズがN =~ (3Million,79)
のデータフレームを持っています。私は、それぞれが前に説明したデータフレームのランダムなサブセットであるサイズ3000の1kデータフレームを作成する必要があります。さらに、それは交換することなくです。そうすれば、データの全体が得られますが、ランダムに1kのデータフレームに分割されます。非常に大きなデータフレームをm個のランダムなn個のデータフレームに分割する -
あなたがあなたのデータフレームを分割したいn
どのように多くの部分で決めたら、あなただけ行うことができます
import pandas as pd
import numpy as np
dfs = np.array_split(df.sample(frac=1), n)
正確に私が必要なもの!ありがとう! –
https://stackoverflow.com/questions/38250710/how-to-split-data-into- 3セットの列車検証および試験 – Wen
あなたの特定の質問は何ですか? –
申し訳ありませんが、私は間違いなく編集を完了していません。 @Wen、nはaprox 10kだから、その質問は役に立ちません、すでに試してみましたが、ありがとう –