私はかなり理解していない機械学習の結果があります。私は、約14のフィーチャーの2百万のデータを持つ、python sciki-learnを使用しています。 'ab'の分類は精密リコールカーブではかなり悪く見えますが、AbのROCは他のほとんどのグループの分類と同じくらいよく見えます。それを何が説明できますか?良好なROCカーブですが、精度が低いリコールカーブ
答えて
クラスの不均衡。
ROC曲線とは異なり、PR曲線は不均衡に非常に敏感です。バランスの取れていないデータで良好なAUCを得るためにクラシファイアを最適化すると、精度の低いリコール結果が得られる可能性があります。
私は参照してください、しかし、それは実際にテストのパフォーマンスの点でどういう意味ですか?それは良いですか(ROCベース)または悪いですか(P-Rベース)?上記のP-R曲線の中で最良のことが精度とリコールの両方で40%であれば、どのようにしてテストを行うことができますか? – KubiK888
これは、不平衡データのテストのパフォーマンスを報告するときに注意する必要があることを意味します。医療アプリケーションでは、それはひどい影響を与えることができます(エイズテストは教科書のケースとして参照してください)。それ以外の場合は、あなたの特定のアプリケーションによって異なります。 – Calimo
私はscikitを使っているのでデフォルト設定を微調整しませんでしたが、AUCに基づいて最適化しているようですが、不均衡なデータのPrecision/Recallペアに基づいて最適化する方法はありますか? – KubiK888
- 1. ROCカーブが正しく見えない
- 2. Tensorflowオブジェクト検出APIの精度リコールカーブ
- 3. 精度、リコール、ソルでのROC
- 4. ケラスCNNトレーニングの精度は良いですが、テストの精度は非常に低い
- 5. ニューロンのネット精度が低い
- 6. 低精度
- 7. 統計モデルのR2が低く、シークレットの精度/精度が高い
- 8. rocカーブとスピーカー認識
- 9. 単純なTensorflow CNNセグメンテーションのテストセット精度が低い
- 10. NSStringのfloatValueで精度が低下していますか?
- 11. 最低の共通倍数がCで倍精度になる
- 12. InceptionV4とV2がInceptionV1よりも「花データセット」の精度が低い
- 13. PRIORITY_HIGH_ACCURACYでも精度が非常に低い
- 14. 低精度の分類色
- 15. Tensorflowドロップアウト実装、テスト精度=列車精度と低、なぜですか?
- 16. より良い精度
- 17. ナイーブベイズ分類器を実装する際の精度が低い
- 18. 倍精度を追加する際の精度の低下
- 19. 数値データの精度が低くなりました。
- 20. ケラスモデルで精度が上がらない
- 21. scikit非常に精度が低い分類器(Naive Bayes、DecissionTreeClassifier)
- 22. Tensorflowを使用したディープニューラルネットワークの精度が低い
- 23. IBM Watsonの音声認識の精度が低い
- 24. 機械学習:バイナリラベルの精度スコアを計算すると、精度スコアが低くなりますか?
- 25. 精度が低下する可能性はありますか?
- 26. エポックケラスの間に精度が低下します
- 27. MNIST neural netowrk:精度はかなり低い
- 28. TensorFlow専門家向けMNIST低精度
- 29. TensorflowマルチGPU MNISTクラシファイア:低精度
- 30. Golang time.Parse()ビヘイビア - 精度が低下したとき000
あなたの設定はバランスが取れていますか? (すなわち、非abと同じくらいab) – Calimo
それは非常に不均衡ではありません、Abは2%未満です – KubiK888
ここに行きます。問題を軽減するためにオーバーサンプリングを試してください。 – Calimo