2017-03-01 8 views
1

ランダムフォレスト法に基づいて述語を行うつもりです。一般的には、ランダムフォレストはすべてのデータポイントを等価とみなし、それに基づいて述語を作成しますが、データポイントの一部にさらに重みを割り当てる必要があります。より明確にするために、データポイントごとに私はウェイトを持っていますので、RFをより多くのデータポイントに偏らせたいと思っています。加重ランダムフォレスト

RFを使ってデータポイントの選択の確率を上げる方法があると思います。私。 RFがより多くの重みを持つ点をサンプリングすると、選択する機会が増え、その結果として予測結果に最も影響する可能性が高くなります。しかし、私はそれを使用する方法がわかりません?それはRF pyhton/rに既に存在していますか?あなたがsklearn.emsemble.RandomForestClassifierでそれを行うことができます

おかげで、 アミール

答えて

-2

。 パラメータclass_weight"balanced"またはカスタム辞書を設定します。

clf = RandomForestClassifier(n_estimators=100, class_weight="balanced") 

詳しくは、official documentsを参照してください。

+0

質問は、クラスごとではなく、データポイントごとに重み付けを求めています –

関連する問題