2017-04-26 10 views
0

私は100000サンプルと分割データをトレーニングとテストセットに無作為にシャッフルする必要がある機械学習に関するPythonのコードに取り組んでいます。私は2つの配列にデータを格納しています。私が次のコマンドを使用すると時間がかかりすぎる。 c=zip(a,b) np.random.shuffle(c) a,b = (*c) ここで、aとbは2つのnumpy配列です。データをランダムにシャッフルし、トレーニングとテストセットに分割する効率的な方法はありますか?一部の人が私を助けることができるPythonコードを提案してもらえますか?データをランダムにシャフリングし、トレーニングとテストセットに分割する効率的な方法は?

答えて

0

この目的で、scikit learn's cross-validation featureの機能train_test_splitを使用するとよいでしょう。

+0

私はscikitを使いたくありません。私は単純なpythonを使用する必要があります。また、私は2つの部分のトレーニングとテストセットだけでデータを分割したいと思います。 – sara

+0

シンプルなpythonコマンドを使用してこのシャッフルと分割を実行するリンクを提案してください、私は感謝しています – sara

関連する問題