0
私はデータセットを持っていて、予測結果に対応するフィーチャを他よりも選択したいと考えています。私はテストの順位、いくつかの機能を実装しているし、ここでの結果です:機能の選択(結果の解釈方法)?
は、私は最高の「平均」値で機能を選択した予測モデルについて。
X = oil_10[['Sidetrack Code','Well Type Code','Well Status
Code','Producing Formation','Water Produced, bbl','County']]
ここで「ベスト選ばれた機能」との予測モデルの結果である:
RandomForestRegressor
0.390502562474
そして、ここでは、任意の選択せずに、すべてのデータセットの機能を備えた予測モデルの結果である:
RandomForestRegressor
0.741878611892
フィーチャランキングの結果を使用して最良の予測結果を実装するにはどうすればよいですか?