0
ランダムフォレストでのツリーの構築に関して疑問があります。 ツリー構築の私の理解では、このです:ランダムフォレストツリーの終点
Suppose
-----------
N (total records of data set) =1000
M (total features) =30
n (Subset) = 500
m (fixed features to be used in RF) = 3
First Tree
-----------
1) Random sample data S1 (n)
2) Take m features from M eg: m2, m16, m29
3) Identify the best attribute – eg: m16 --> root node
4) Split S1 on m16 – gives 2 new subsets eg: S1_a and S1_b
5) For S1_a, select m eg: m1,m5,m10
6) Identify the best attribute – eg: m1
7) Split S1_a into S1_a1, S1_a2
8) For S1_b, select m eg: m11,m15,m10
9) Identify the best attribute – eg: m15
10) Split S1_b into S1_b1, S1_b2
Question is : When does this splitting get over ?
i.e.After step 7, does S1_a1, and S1_a2 further split ? When does it end ?
Regards
Sri
Thanks Tim。今それは理にかなっています。ほとんどのチュートリアルでは、ツリーを構築することについて話していますが、終了するタイミングについては何も話していません。ツリー構築プロセスを描こうとしている間は、ちょっと進んでいるようです。分割サイズ(ノードサイズ)について、デフォルト値はありますか? – Sri
これは、使用している実装によって異なります。 Rの 'randomForest'パッケージでは、回帰モードのデフォルトのノードサイズは5と考えています。 –