私はバイナリ分類の問題(誤検出のコストが高い)の精度を最大限にしようとしています。データセットも実際に不均衡です。偽陽性に対抗するために、体重列を2回目に使用してDRFまたはXGBOOSTモデルを2回実行するのは理にかなっていますか?H2Oランダムフォレストとxgboostでの重みカラムの使用
これらのH2Oアルゴリズムには、この潜在的な方法の他に、(ログ損失ではなく)精度を最大化するための他の方法がありますか?私はアンサンブルを使うつもりです(精度を上げるようです)。相互検証は役に立ちません。