2017-03-04 13 views
-1

私のデータセットには300kの行があり、70/30の分割を行い、結果は正真正銘の偽陽性の偽陽性モデルを見るまで、正の数と真の負の数。なぜ分類ラベルがほとんどないのですか

TPが20で、FNは2 FPは3ですとTNは極めて低いです41

のですか?だから結果は素晴らしいですが、もしモデルが90 000の66しか分類できないのであれば、むしろ無駄です。

これを改善するにはどうすればよいですか? 2クラスブーストされた意思決定ツリーまたはニューラルネットは、それほど大きな結果を変えない。どんな勧告?

+0

これはバイナリの分類ですか?ここで実験リンクを共有できますか? –

答えて

0

データセットに欠損値があるかどうか確認してください。

関連する問題