ランダムフォレスト(または他の見積もり)を複数回実行して実行間の変動を滑らかにするためにsklearnにパラメータを調整できますか?これを行う最も簡単な方法は何ですか?ランダムなフォレストの反復の平均をとるには?
-2
A
答えて
0
手動で実行間のバリエーションを単純に滑らかにすることはできません。あなたができることは、GridSearchCVを使ってハイパーパラメータチューニングを実行することです(あるいは、at this linkなどの他の同様の方法を参照することもできます)。また、見積もりのパフォーマンスを向上させるためにデータセットのCross-validationを見ることもできます。私たちはより良いあなたを助けることができるようにSklearn for cross-validationに。
またなど、あなたが解決している問題のタイプのように、あなたの問題のためのデータセットをより多くの情報を提供してください。
0
VotingClassifier
ソフト投票であなたが何であるかかもしれ一般に、2組の予測がある場合、予測の幾何平均を取って平滑化することができます。
from scipy.stats.mstats import gmean
df = pd.DataFrame()
#prediction renamed in 1.csv,2.csv... for convenience
for i in range(1,4):
data = pd.read_csv('{}.csv'.format(i),index_col='id')
data = data.rename(columns={'proba':i})
df = pd.concat([df,data],axis=1)
df['proba'] = gmean(df.iloc[:,1:4],axis=1)
output = pd.DataFrame(data={'id':df.index,'proba':df.proba})
output.to_csv('submissions.csv',index=False)
関連する問題
- 1. MySQLの平均値の反復
- 2. 反復サンプル平均をデータフレームに保存する方法は?
- 3. Rのランダム反復ループ
- 4. 平均値を計算するためにデータフレーム列を反復する
- 5. 平均の平均 - 異なるサンプルサイズの平均を集計する方法
- 6. ランダムな配列内の個々の行と列の平均を見つける
- 7. 平均距離とigraphの障害平均平均
- 8. R、sqldfと平均平均の平均値
- 9. Matlabでループと反復が不均一
- 10. 反復可能なツリーを平滑化
- 11. Rデータフレームにおける異なる処理および反復カウントの平均を取る
- 12. 'numpy.float64'オブジェクトは反復可能ではありません - 平均クラスタリング
- 13. 平均相関がランダムな相関行列を生成する
- 14. ランダムなフォレストの結果をファイルに書き込む
- 15. Javaの平均的な平均数と乱数
- 16. 同形反応の平均とは何か
- 17. Forループ内での反復各反復ごとに異なる
- 18. 範囲からのランダム反復値
- 19. 配列上のランダム反復(シャッフルではない)
- 20. RのCaretパッケージは線形モデル(lm)とランダムなフォレストを混同します
- 21. 平均のチャート上のタブロー平均線
- 22. Tableau平均値を上回る平均
- 23. ランダム生成WP7で反復数を避けるには?
- 24. 個々の平均と累積平均と最高平均スコアを記録する
- 25. ランダムなフォレストで学習曲線を使用する方法
- 26. Spark:Scalaを使用したreduceByKeyの値の平均ではなく値の平均
- 27. Pythonでランダムなフォレストを持つ複数のクラスを予測する方法は?
- 28. multivariate_normalメソッドの平均出力が分布の平均と異なるのはなぜですか?
- 29. 平均とダイナミックレンジ
- 30. 反復せずにランダムなキャラクタを選ぶC++