私がパラメータclass_weight
を使用するとき、scikit-learnがクラスに重点を置く方法を知りたいのですが、それは少数サンプリングのオーバーサンプリングですか?scikit-learnでのclass_weight強調の方法
ありがとうございました。
私がパラメータclass_weight
を使用するとき、scikit-learnがクラスに重点を置く方法を知りたいのですが、それは少数サンプリングのオーバーサンプリングですか?scikit-learnでのclass_weight強調の方法
ありがとうございました。
すべてのアルゴリズムでclass_weight
を処理する単一の方法があるかどうかはわかりません。
ディシジョンツリー(およびフォレスト)は、各サンプルの重みをクラスに応じて変更することで対応します。
オーバーサンプリングのより一般的なケースとしてサンプルを重み付けすることが考えられます。すべて少数派のサンプル(サンプルの一部を「オーバーサンプルする」ことができます)。
これは一般に当てはまります。しかし、私はそれが実際にどのように行われているのかという疑問はあると思いますか? – AndreyF
はい、質問は、それが過半数のクラスをどのように不利にするかです。 – Peter