2016-12-09 25 views
0

私はsklearn RFCを使用しています。ランダムフォレストクラシファイア:予測確率の特徴重要度

forest.fit(training_data, y_train) 
probas_test = forest.predict_proba(test_data) 

私は、予測につながる各機能の寄与度/重要度を見つける方法があることを知りたがっていました。

個別のデータポイントのようなものですが、

forest.feature_importances_ 
+0

はあなたが望むもの恩返し.features_importances_' 'ではないでしょうか? – MMF

+0

@MMFにお返事ありがとうございます。これは完全な訓練されたツリーを返しますが、私はlabel'edデータであるという個々の予測のためにこれらのパラメータを探しています。 – OneWorld

答えて

0

これは多くの方法で解決できます。 http://blog.datadive.net/interpreting-random-forests/(そのためのPythonパッケージ:https://github.com/andosa/treeinterpreter)をチェックしてください。直接的な選択肢も少なくなっています。

+0

これはまさに私が探していたものです。ありがとう! – OneWorld

関連する問題