現在、ロジスティック回帰やランダムフォレストなどの分類学習アルゴリズムを使用して信号を推定するプロジェクトでは、scikit-learnを使用しています。シグナル予測の偽陰性率を下げる
私は現在、混乱行列を使用して予測の異なるアルゴリズムのパフォーマンスを評価していますが、両方のアルゴリズムに共通の問題があることがわかりました。すなわち、いずれの場合も、アルゴリズムの精度は比較的良いと思われる(約90%〜93%)が、FNの総数はTP(FNR < 3%)に比べかなり高い。私の予測問題でこのような問題が発生している理由を知っている人がいますか?可能であれば、この問題を解決する方法についていくつかのヒントを教えてください。
お返事ありがとうございました。
更新日: データセットは非常に不均衡(8:1)で、合計約180,000回の観測があります。私はすでにOSS、SMOTE(+ Tomekまたは+ ENN)などのいくつかのリサンプリング方法をテストしましたが、どちらも良い結果を返していません。どちらの場合も、リコール率は2.5%から20%に上昇しますが、精度は大幅に低下します(60%から20%)。
ライブラリを使用していますか? –
はい、Scikitを使用しています。 – Biertje