他のランダムフォレストツールには、特定のブランチ上の分割の最大深さを制限する「ダイヤル」があります。'R'パッケージの "ranger"の "max depth"に相当するものは何ですか?
h2o.randomForestには、たとえば「max_depth」があります。
「レンジャー」のバージョンは何ですか?
他のランダムフォレストツールには、特定のブランチ上の分割の最大深さを制限する「ダイヤル」があります。'R'パッケージの "ranger"の "max depth"に相当するものは何ですか?
h2o.randomForestには、たとえば「max_depth」があります。
「レンジャー」のバージョンは何ですか?
私はh2o.randomForest
パッケージに精通していませんが、ランダムフォレストの一般的な理解は、ツリーの各葉に一定数のデータポイントが収まるまで各ツリーが成長することです。言い換えれば、ツリーは、各データポイントのあるレベルの分類が達成されるまで分割し続ける。標準randomForest
パッケージでは、これを制御しnodesize
と呼ばれるパラメータがあります:
https://stats.stackexchange.com/questions/158583/what-does-node-size-refer-to-in-the-random-forest
ranger
パッケージにおける類似のパラメータはmin.node.size
のようです。上記のリンクの情報をdocumentationと比較すると、両方が同じことについて話し合っていることがわかります。
最大深度は、切り株と葉の間の分割数です。これは、オーバーフィットを回避するために使用される制御パラメータです。 – EngrStudent
@EngrStudent私は、オーバーフィットがランダムな森林にとって大きな懸念であるとは思わない。いずれにしても、ノードのサイズによって分割の制御が同じになります。 –
余計なことはありません。それは最大の問題ではありませんが、調整されたパフォーマンスが必要な場合は調整する必要があります。バイナリツリーの分割数を制限すると、計算時間の上限が設定されます。 – EngrStudent