2017-06-01 6 views
0

従属変数が0または1のデータセットがあります。ただし、0の膨大な数(1の10倍)があります。従属変数の比率が等しいサブセットを作成するのが最速の方法は何ですか?従属変数0と1の等しい割合でデータを均等に分割する

+0

私のデータセットは800000行と従属変数 –

+0

あなたは800000行で何を意味するかと一緒に20の独立変数を持つ巨大です、それはファイルか何かですか? – gushitong

+0

これはデータフレームです。はい、ファイル –

答えて

0
dataset = [0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 

subset = [] 

for i in range(sum(dataset)): 
    subset.extend([0, 1]) 

print(subset) 
+0

私のデータセットは、800000行と20個の独立変数と、従属変数で膨大です。 –

+0

あなたはあなたの質問のすべてをクリアする必要があります。 @RikinMathur – gushitong

関連する問題