-1
私は2つのクラス(+1
、-1
)を持つ不均衡なデータセットを持っています。ポジティブはデータセットのわずか7%です。不均衡なデータセットのサンプリング比率
Desicion Treesを使用して分類したいと考えています。
- 陽性の同じサイズ
- 陽性のダブル、トリプルサイズ:私はにネガをダウンサンプリングしようとしています。
これらのすべてについて、私はほとんど同じ精度を得たが、陽性のリコールは最初のサンプル(陽性と同じサイズのネガ)ではるかに良好であった。しかし、私はここで何かが欠けていると感じるので、このサンプリングについて何が悪いですか?