2017-09-28 16 views
-2

こんにちは、私はプロダクトlogerrorにランダムなフォレストクラシファイアを使用しています。ログエラーには、両方とも= ve & -veの値が含まれています。異なる設定で分類子を実行した後。私は約0.8のトレーニングテストのスコアを得ることができますが、テストのスコアは常に負です。どうしてこんなことに? 予測にabs(ログエラー)を使用する必要がありますか、またはランダムフォレストの選択に間違いがありますか?ランダムフォレストのネガティブテストスコア

答えて

-1

私はあなたの質問を完全に理解していません。 「製品ログエラー」とは何ですか? "both = ve & -ve"とは何ですか? また、あなたのテスト得点が何であるかわからない。しかし、どういうわけかあなたはあなたがログを使うことに言及しました。 エラーが0〜1の場合、ログ(エラー)は負になります。 エラー= 1の場合は0 、エラーの場合は1より大きくなります。

0

ランダムフォレストの選択は間違っている可能性がありますが、ここでデータを共有しているかのようにデータのコンテキストで確認する方がよいでしょう。正確な時点であなたを助けてくれます。しかし、あなたの全体の観測が1000-2000程度であればKnnを試してみることをお勧めします。

また、カテゴリデータを公称値に変換するために任意の種類のエンコーディングを使用している場合は、他の値を属性として追加するだけでホットエンコーディングを使用してください。

テストデータのターゲット変数の相関が低いと、マイナスの結果になる可能性があるため、ターゲット変数との相関をチェックする必要があります。

上記以外のデータの配信は、ランダムフォレスト回帰において重要な役割を果たします。したがって、分布を調べて、box-coxなどのメソッドを適用して正規分布のデータを変換してみてください。

関連する問題