検索と質問をすることで、私は自分のサーバーのすべてのコアと、ランダムフォレストを実行できる多くのパッケージを使用するために使用できる多くのパッケージを見つけました。ランダムフォレストのパラレル化
私はこれでかなり新しく、ランダムフォレストのトレーニングを並列化するためのあらゆる方法の間に迷っています。それぞれを使用する理由と回避する理由、またはそれらの特定の組み合わせ(およびcaret
?ありまたはなし)の理由でいくつかアドバイスをしてもらえますか?並列化のための
パッケージ:
doParallel
、
doSNOW
、
doSMP
(?廃止)、
doMC
mclapply
について、何?)ランダムフォレストのの
パッケージ:
[caret
+次のいくつかの]
、
parRF
、
randomForest
、
ranger
、
Rborist
、
parallelRandomForest
(私のRスタジオセッションをクラッシュ...)
おかげ
これはあなたが非常に多くの木が必要であると判断したことを意味しますか? –
私はあなたのアドバイス(およびいくつかの機能エンジニアリング)とトレーニング時間のおかげで使用される機能の数を減らすことができました。しかし、残念ながら、私はまだ多くの木を持っている必要があるようです。 (しかし私はいくつかのことを間違えているかもしれませんが、私はまだ探検しています –
一般的なアドバイス:この質問は多少幅があるので、あまりにも多くの回答を引き付けないかもしれません。 Rパッケージを計算し、さらにはランダムなフォレストを持つ単一のパッケージについて質問するのがよいでしょう。 –