私はscikit-learnを使ってExtraTreesClassifier(giniインデックス)を訓練しました。それは私のニーズにかなり合っています。それほど正確ではないが、10倍のクロスバリデーションを用いると、AUCは0.95である。この分類器を自分の仕事に使用したいと思います。私はMLにはかなり新しいので、あなたに何か概念的に間違っていることを尋ねるなら、私を許してください。ROCの結果に基づいてsklearnクラシファイアのしきい値を設定するにはどうすればよいですか?
私はいくつかのROCカーブをプロットしました。それによって、私の分類器がうまく動作し始める特定の閾値があるようです。この値をフィット分類器に設定したいので、予測を呼び出すたびに分類器がそのしきい値を使用し、FPとTPレートを信じることができます。
私はこの投稿(scikit .predict() default threshold)にも来ました。ここでは、しきい値は分類子の一般的な概念ではないと述べています。しかし、ExtraTreesClassifierにはpredict_probaというメソッドがあり、ROCカーブもthresdholdsの定義に関連しているので、それを指定する必要があります。
パラメータやそれを使用するためのクラス/インターフェイスが見つかりませんでした。 scikit-learnを使用して、訓練されたExtraTreesClassifier(またはその他のもの)のしきい値を設定するにはどうすればよいですか?
多くのおかげで、 Colis
こんにちはホワイト、お返事に感謝。私はroc_aucと他のメトリックを選択して最適化しました(私はLR +を最適化するカスタムスコアラーを作成しました)。私の主な疑問は、私がpredict()を呼び出すときの閾値としてROC曲線上の点によって示される閾値の1つを選択する方法ですか?私の質問は、()に関するものです。 通常はプロバスを使用しないので、これは樹木に利用できるかどうかはわかりません。しかし、他の方法のためにそれを設定する方法は、次に? –
Colis