2016-08-11 12 views
0

ランダムフォレストクラシファイアを使用してデータセットをモデリングしています。ランダムフォレストによって選択されている機能を印刷したい。 次のように私はfeature_importances_を使用していますランダムフォレストでモデリングした後にフィーチャを印刷する方法は?

modelRF.feature_importances_ 

をしかし、それのようにエラーを示している。

AttributeError: 'RandomForest' object has no attribute 'fit'

:「フィット」法を使用しても

NameError: name 'feature_importances_' is not defined

、それはのようにエラーを与えています

ランダムフォレストクラシファイアで使用されるパラメータは次のとおりです。

(data, x_cols, y_col, num_trees, method, impurity, max_depth=10, min_instance_per_node=20, min_information_gain=0.01, max_bin=32, feature_subset_strategy=u'auto', seed=123, async_execution=False) 

ランダムフォレストを使用して選択した機能を印刷したいとします。

上記の方法をランダムフォレストで使用するには、いくつかの追加事項を定義する必要がありますか?(私はadatao/arimoパッケージを使用して分散プラットフォームでRFをモデリングしています)

答えて

0

ランダムフォレストクラシファイアで選択された機能を提供するarimoパッケージにvariable_importanceという名前のモジュールがあります。

それは> 0.0 importance scoreを持っているvariable nameがランダムフォレスト分類器により選択された機能ですvariable name, importance score

でパンダのデータフレームを与えます。 これはPythonのarimoパッケージで分散プラットフォーム用に使用できます。

model.feature_importances_ 

は、他のパッケージでは他に使用できます。