2016-04-24 28 views
-2

368個の独立変数を含むデータセットがあります。現在、ランダムフォレスト分類を使用して、データの動作を説明する上で最も重要な変数を特定しています。私はPythonですでにこれをやった、と私の結果として、このようなものを発見した:Python:10個の最も重要な変数を取得

[(0.3748, 'var38'), (0.1738, 'var15'), (0.0294, 'saldo_medio_var5_ult3'), (0.0281, 'saldo_medio_var5_hace3'),...] 

結果は、すべての368個の変数について得られます。グラフ上でこれをすべてプロットしようとするのは不要なので、私がしようとしているのは、Pythonに10個の最も重要な変数だけをリストさせることです。

私はどのようにしてこれを行うでしょうか、これをグラフ上にどのように表示するのでしょうか?どんな助けでも大歓迎です!

+0

*重要な点* –

+0

変数名の左側にある数字です。数値が高いほど、変数がデータの動作を説明する上で重要です。 –

+1

だから、基本的に 'lst.sort(reverse = True)'と返された最初の10個の値を取る? –

答えて

1

数字が重要であると仮定すると、リストを並べ替えて最初の10個の項目を切り取るだけです。

variables.sort() 
print variables[:10] 
関連する問題