map-reduceフレームワークでナイーブベイズ分類アルゴリズムを使用してデータセットを分類しようとしています。 私の質問は、データセットを訓練とテストに分けて、訂正された分類されたインスタンスと不正確な分類されたインスタンスから正確さを計算する方法です。列車とテストセットにデータセットを分割する方法は?
答えて
あなたがRemovePercentage
フィルタ トレーニングセットを使用することができますフィルタを適用し、完全なデータセット 2.スプリット 4の正しい割合を設定 3.前処理パネルのRemovePercentageフィルタを選択 1.ロードを 5新しいファイルとして生成されたデータを保存
テストセット: 1ロード完全データセット(または単にデータセットへの変更を元に戻す元に戻すを使用)2. まだ3を選択していない場合RemovePercentageフィルタを選択。 invertSelectionプロパティをtrueに設定します。 4.フィルタを適用する 5.生成されたデータを新しいファイルとして保存する
データセットは約1ギガ、wekaは大きなデータを供給しません 助けが必要ですか? – medooSa
@medooSa Rプログラミングをお勧めします.GUIインターフェイスが必要な場合は、RStudioより優れたものはありません。 Rを学ぶための良いオンラインリソースはR-bloggersです。しかし、PCAやk-meansと比較すると、Rで同じことをすると5分もかかりません。 (私は効率の面でこれをテストしました) R以外にもRapidMinerやApache Hadhoopがありますが、私の意見ではwekaはbigdataのために最高です...私はあなたにゲートを見せることを提案します[LINK ](https://gate.ac.uk/) – Boschko
私は、eclipseを使ってコンパイルされたjava .jarファイルを作成しました。 Rプログラミングで.jarファイルをインポートして作業することが許可されているか、Rプログラミングを使用してすべてのコードを書き込む必要がありますか? // CRAN: – medooSa
- 1. イメージデータセットを電車とテストセットに分割する方法は?
- 2. Excel - 均等に分散された列車とテストセットにデータを分割する方法
- 3. Matlabは列車/有効/テストセットに分割され、比率を維持する
- 4. 文書をトレーニングセットとテストセットに分割する方法は?
- 5. 列車とテストセットの両方のダミー変数を取得する方法は?
- 6. トレーニングとテストセットの分割
- 7. 列車とテストデータセットをX_train y_trainとX_Test y_Testに分割する方法?
- 8. トレーニング検証顔面データセットのテストセットを分割
- 9. TensorFlow:列車とテストセットで常にニューラルネットワークの精度が100%
- 10. python列ごとにグループを分割する方法各グループのデータセット%
- 11. 列車とテストセットの異なるレベルのパイプラインでのダミー作成
- 12. トレーニングとテストセットへの入力を分割する
- 13. Python:2データセットのデータセットを分割する
- 14. データをランダムにシャフリングし、トレーニングとテストセットに分割する効率的な方法は?
- 15. 大きなデータセットをGoogleのサイトマップに分割する方法
- 16. Juliaでアレイをトレーニングとテストセットに分割する効率的な方法は何ですか?
- 17. 列を分割する方法は?
- 18. IDに依存するトレーニング、検証、およびテストセットにデータフレームを分割する方法は?
- 19. 異なるクラスの画像をPythonのトレーニングセットとテストセットに分割する
- 20. 行列を等しい部分に分割する方法は?
- 21. データセットをデシルに分割するR
- 22. データセットをチャンクに分割する
- 23. "PimaIndiansDiabetes"に複数の確率でIFELSEを使用してデータをトレーニング/テストセットに分割する方法は?
- 24. Rのデータを複製せずにデータセットを分割する方法は?
- 25. ベクトルの列を2つの列に分割する方法は?
- 26. 配列を小さな配列に分割する方法は?
- 27. 文字列をjavascript配列に分割する方法は?
- 28. パンダの列に文字列を分割する方法は?
- 29. パンダの列を分割する方法
- 30. 文字列を分割する方法
ランダムサンプリングを使用したことはありますか? –