私は自分のデータセットを無作為にトレーニングとテストのデータに分割して、Javaのナイーブベイズ分類にしたいと思っています。私はwekaを使う選択肢が1つありますが、私は外部ライブラリを使いたくありません。私はjavaを使って他にどのような可能性がありますか?データセットを無作為にトレーニングとテストを使ってJavaに分割する
0
A
答えて
1
あなたはrandomly permute the indicesとすることができます。次に、インデックスされた要素の最初の75%を新しい配列にコピーします。
0
私は自分の問題を解決し、データをトレーニング(75%)とテストセットに分割したと思います。後でスワップを使用してデータをランダム化しました。データをランダム化するための
コード:
private static void shuffleArray(ArrayList<Record> records) {
int n = records.size();
Random random = new Random();
random.nextInt();
for (int i = 0; i < n; i++) {
int change = i + random.nextInt(n - i);
swap(records, i, change);
}
}
private static void swap(ArrayList<Record> records, int i, int change) {
Record helper = records.get(i);
records.set(i, records.get(change)) ;
records.set(change, helper);
}
関連する問題
- 1. トレーニングとテストのデータを無作為に分割する
- 2. トレーニングとテスト用にXDFファイル/データセットを分割する
- 3. データをトレーニングとテストに分割する
- 4. 分割データセットをトレーニングとテストに分割する(トレーニングデータには各クラスの200の例があります)
- 5. MATLABのテストとトレーニングのための分割データセット
- 6. スペースで文字列を無作為に分割する( "")
- 7. dplyrを使って無作為にサンプリングして変数を割り当てる
- 8. Pythonのトレーニングとテストのタイムスタンプに基づいてユーザーごとにデータセットを分割します
- 9. データパーティションをトレーニング、テスト、および検証に分割する - Rで分割する
- 10. ベクトルをMATLABで無作為に2つのベクトルに分割する
- 11. テストのために無作為に引っ張ってください
- 12. Rで設定したトレーニングとテストに分割しますか?
- 13. トレーニング検証顔面データセットのテストセットを分割
- 14. 特定のインデックスを使用してデータセットをテスト、検証、トレーニングに分類する方法は?
- 15. 無作為に各テーブルセルに異なる名前を割り当てます。
- 16. 単変量時系列とトレーニングとテスト分割へR
- 17. トレーニングとテストセットの分割
- 18. QDA |トレーニングデータとテストデータの長さ|トレーニングとテストのデータを分割する方法は?
- 19. SOMのトレーニング/テストにデータを分割する理由は何ですか?
- 20. データセットをデシルに分割するR
- 21. データセットをチャンクに分割する
- 22. Python:2データセットのデータセットを分割する
- 23. Rのデータをトレーニングと検証に分割する方法は?
- 24. IIS7エラー500無作為に
- 25. クラスバランスの取れていないデータセットを使ったトレーニング
- 26. 無作為にクラッシュするUITableView
- 27. 無作為に選択するEarlGrey
- 28. Java、シフトを使って文字列を分割する方法
- 29. Javaを使ってregexに基づいてファイルを分割する方法
- 30. Chromeブラウザでセレングリッドとセッションを作成できません。テスト用に無作為にハングアップするだけです。
あなたはJavaで独自のランダム化を定義することができますか?彼らは均等に分割する必要がありますか?または大多数のトレーニングとサブセットをテストに使用しますか? –
私は、トレーニングとして75%、テストデータとして25%をこの制約なしに保つという制約があります。 –
私はどこに問題があるのかわかりません。簡単に聞こえますが、あなたが自分でこれを実装するのが難しいところを正確に説明しているかもしれません。あなたがこれまでに試したことを私たちに教えてください。現在の状態であなたの質問が広範であることを意味します。あなたの全データから、訓練セットのエントリの75%をランダムに選択し、残りをテストデータとして使用します。 – Zabuza