私はsklearnを使用して一部のデータを学習しています。これはバイナリ分類タスクであり、私はRBFカーネルを使用しています。私のデータセットはかなり不均衡(80:20)で、120サンプルしか使用せず、10インチのフィーチャーを使用しています。私がclass_weight="auto"
を設定して以来、十字型(10倍)のgridsearchから計算した精度は劇的に低下しました。なぜ??クラスウェイトを使用してデータセットのバランスを調整すると、RBF SVMの精度が低下する
違いを実証するために、2つの検証精度ヒートマップが含まれます。
注:classweightがautoに変更された前のトップのヒートマップです。
私は本当の肯定的な率をチェックしているだけでなく、正確なパフォーマンスを分析して、クラスの重みを変更する前に、プレディクタは(最高で)マイノリティグループの24のうち5または6を得ました。しかし、まだそれを変更した後、複数を取得する – bidby