2017-05-31 5 views

答えて

0

私はh2o.randomForestパッケージに精通していませんが、ランダムフォレストの一般的な理解は、ツリーの各葉に一定数のデータポイントが収まるまで各ツリーが成長することです。言い換えれば、ツリーは、各データポイントのあるレベルの分類が達成されるまで分割し続ける。標準randomForestパッケージでは、これを制御しnodesizeと呼ばれるパラメータがあります:

https://stats.stackexchange.com/questions/158583/what-does-node-size-refer-to-in-the-random-forest

rangerパッケージにおける類似のパラメータはmin.node.sizeのようです。上記のリンクの情報をdocumentationと比較すると、両方が同じことについて話し合っていることがわかります。

+0

最大深度は、切り株と葉の間の分割数です。これは、オーバーフィットを回避するために使用される制御パラメータです。 – EngrStudent

+0

@EngrStudent私は、オーバーフィットがランダムな森林にとって大きな懸念であるとは思わない。いずれにしても、ノードのサイズによって分割の制御が同じになります。 –

+0

余計なことはありません。それは最大の問題ではありませんが、調整されたパフォーマンスが必要な場合は調整する必要があります。バイナリツリーの分割数を制限すると、計算時間の上限が設定されます。 – EngrStudent

関連する問題