私はnumpyとpandasを使用してトレーニング、検証、テストにデータを分割しようとしています。パンダのベクトル値の範囲に基づいて行を選択
私は(それがsklearn
アイリスの例からだ)、この作品を知っている:
DataFrame['is_train'] = np.random.uniform(0, 1, len(train)) <= .75
train, test = DataFrame[DataFrame['is_train']==True], DataFrame[DataFrame['is_train']==False]
しかし、私は、値の範囲のために似たような、例えば、どのように行うのですか、0.33 < X < 0.66?
これは動作しません:あなたはより良い方法を知っている場合
DataFrame['segment'] = np.random.uniform(0, 1, len(df))
DataFrame[DataFrame['segment'] < .33 & DataFrame['segment'] < .66]
最後に、教えて祈ります。
私の知る限り、sklearn
のcross_validation.train_test_split()
は3方向分割を行いません。
小さな間違い: DataFrame [データセグメント] [データセグメント] [データセグメント] [.66] 答えのために、Edchumは明確かつ簡潔です! – ysearka