最近のバージョンのscikit-learnパッケージにはBalanced Random Forest(BRF)の実装があるのだろうかと思います。 BRFは、不均衡なデータの場合に使用されます。これは通常のRFとして機能しますが、ブートストラップの繰り返しごとに、アンダーサンプリングによって流行クラスのバランスをとります。例えば、N0 = 100、N1 = 30の2つのクラスが与えられた場合、それぞれのランダムサンプリングで、第1のクラスから30個のインスタンスが得られ、第2のクラスから同じインスタンスがインスタンス化されます。平衡データセット。詳細はplease refer to this paperをご覧ください。scikit-learn(python)のバランスランダムフォレスト
RandomForestClassifier()には 'balance_weight ='パラメータがありますが、これは 'balanced'に設定されている可能性がありますが、ブートスクラップされたトレーニングサンプルのダウンサンプリングに関することはわかりません。
あなたは解決策を見つけましたか? – oliversm
@oliversm、残念ながらそうではありません。私はこの問題を去った。おそらくscikit学習フォーラムで問題を開き、解決策を提案するべきでしょう。それは素晴らしいだろう。 –
Briemanによって提案された方法は、Scikitが既に提供しているものを使って実装するのはかなり簡単です。見過ごされているようですが、残念です。 – oliversm