私のデータの形式は次のとおりです。ランダムフォレストは
stock st1 str2 str3 str4 str5 str6 str7 str8
A 1 0 0 0 1 0 0 0
A 0 0 0 0 0 0 0 0
A 1 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
B 1 0 0 0 1 0 0 0
C 0 0 0 0 0 0 0 0
C 1 0 0 0 1 0 0 1
C 0 0 0 0 0 0 0 0
C 0 0 0 0 0 0 0 0
C 1 0 0 0 1 0 0 1
A 0 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
A 1 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
C 1 0 0 0 0 0 0 0
私はデータ分析に新しいですし、私はこのデータ形式で実装することができるもの分析知りたいのです。ランダムな森林と枝打ち樹状突起を持つことは可能ですか?いくつかのランダムDF 100行で生成してテストした決定木を持つ列のST1、STR2、STR3など
は非常に明確ではありません。 (1)各株式タイプ(A、B、C)のクラスタを検索しますか? OR (2)ストックラベルに対応するstr1、str2、str3 ...のパターンを検索しますか? –
@sandipan – Jake