私は、3つのラベル「d」、「e」および「k」を有する分類されたデータのセットを持っています。私は分類子を訓練して 'd'を識別し、それらをデータセットから削除し、 'e'を識別したいと考えています。現在、データを3分の1に分割しています。これをX1、X2、X3と呼びます。 X1で学習者L1を訓練し、その学習者を使ってX2上の 'd'ラベルを取り除き、それを使ってX3でテストする第2の学習者L2を訓練します。これは合理的なアプローチですか、このようなシナリオでは標準が採用されていますか?1つのデータセットで2つの異なるアルゴリズムによる相互検証
0
A
答えて
0
一般に、クラシファイアのパフォーマンスを評価するための一般的な手法として、データセット全体(複数の「フォールド」を使用)を使用するクロスバリデーションと、一部のデータを除外するホールドアウトセット評価のためのトレーニングから。典型的には、ホールドアウト・セットは、トレーニングに使用されるデータ(例えば、80/20または70/30)よりもはるかに小さい。
この場合、1つのオプションはホールドアウトセットを維持することです。学習セットの学習と変更、すなわち分類器の訓練、 'd'要素の除去、別の分類器の訓練、 'e'要素の識別、その後、ホールドアウトセットに対してプロセス全体をテストします。
関連する問題
- 1. 1つのモデルで2つの異なるフォームで条件付きの検証
- 2. 1つのコントローラで2つのフォーム間の相互作用
- 3. 2つの異なるアルゴリズムによるクラスタ結果のマッピングR
- 4. ファイルで区切られたデータセットの相互検証
- 5. Jquery検証で1つのエラーで2つのフィールドを検証する方法
- 6. 異なる検証要件を持つ2つのエンティティを1つのテーブルにマップする
- 7. Wekaの相互検証のための順序を保つ
- 8. 2つの検証メッセージによるjqueryフォームの検証
- 9. Python Matplotlib 2つのNetCDFデータセットの相違
- 10. SSRS - 1つのタブリックスと2つのデータセット
- 11. 2つの異なるDataAnnotation検証スタイルとCSSを使用
- 12. backbone.jsで2つの異なるテンプレートを交互に表示
- 13. 1つのインストールで2つの異なるapkをインストールする
- 14. 2つの異なるユニフォームサンプラーに1つのテクスチャーをバインドする
- 15. 2つの異なるシーンで1つのクラスで2つのGridPaneを取得
- 16. 2つの配列の相互比較
- 17. 2つのテーブル間の相互参照
- 18. 固定データセットの2つのクラシファイア間の相互情報の計算
- 19. 2つの異なるアルゴリズムのカウンタの2つの同じ結果
- 20. ggplotで異なる色のスケールを持つ2つのデータセットを重ねる
- 21. 2つの別々のデータセットの値を1つのデータセットに一致させる
- 22. joinステートメントを使用して2つの異なるデータセットからC#で1つにデータをリンクする
- 23. 1ページ、2つのモーダル(2つの異なるアクション)
- 24. 2つのワードプレスサイトの異なるオプションテーブルを持つ1つのデータベース
- 25. 2つの異なるフォントサイズ1行CSS
- 26. skitlearnでの相互検証とスタンダード化
- 27. 2つのwhere文と1つのデータセットでマージするPROC SQL
- 28. スパークランダムフォレスト相互検証エラー
- 29. 2つの異なるActiveRecordコレクションを1つにまとめる
- 30. 2つの異なるSQL文を1つにまとめる
なぜ「e」を見つける前に「d」を取り除かなければならないのですか?これは何らかの方法でパフォーマンスを向上させることですか? (もしそうなら、それは必ずしも私が取るアプローチではない) – etov
このように問題に近づくパフォーマンスの改善があるかどうかは、私は実際にはわかりません。私にチェックさせて、私は "結果"を投稿します。 – johnklawlor
2番目の考えでは、私はここでの目標を理解していません。あなたはクラシファイアのパフォーマンスを測定しようとしていますか?または実際に 'd'を削除し、注釈のない一部のデータで 'e'を識別することができますか? – etov