データを2つのランダムなセットに分割したいと思います。Pythonでデータをランダムなセットに分割する
ind = np.random.choice(df.shape[0], size=[int(df.shape[0]*0.7)], replace=False)
X_train = df.iloc[ind]
今、私は私のテスト・セットを作成しないind
で「すべてのインデックスを選択したいと思います:私は、最初の部分をやりました。どうすればいいか教えてください。
私はそれが
X_test = df.iloc[-ind]
だろうと思ったが、どうやらそれは、この純粋なPythonのアプローチを試してみてください
したがって、テストデータとして70%を選択し、残りの30%をトレーニングデータとして使用しますか?より簡単な方法は、np.random.shuffleを使用してインデックスをシャッフルし、シャッフルされたインデックスの最初の70%をトレーニングとして使用し、テストとして休むことです。 –
はい、まさに私が欲しいものです – jlt199