0

私はデータセットを持っていて、予測結果に対応するフィーチャを他よりも選択したいと考えています。私はテストの順位、いくつかの機能を実装しているし、ここでの結果です:機能の選択(結果の解釈方法)?

enter image description here

は、私は最高の「平均」値で機能を選択した予測モデルについて。

X = oil_10[['Sidetrack Code','Well Type Code','Well Status 
Code','Producing Formation','Water Produced, bbl','County']] 

ここで「ベスト選ばれた機能」との予測モデルの結果である:

RandomForestRegressor 
0.390502562474 

そして、ここでは、任意の選択せずに、すべてのデータセットの機能を備えた予測モデルの結果である:

RandomForestRegressor 
0.741878611892 

フィーチャランキングの結果を使用して最良の予測結果を実装するにはどうすればよいですか?

答えて

0

私はこのように自分の問題を解決しようとしました: 平均重要度が0.15未満の重要度の低い機能を落としたところ、精度は同じ75%でしたが、 。

関連する問題