大きな列車でランダムなフォレストを実行する必要がありますが、53レベル以上の変数は使用できません。ファクタ変数からレベルを下げる
要因変数(train$tip
)削減する必要があるのは、150レベル(KHC、KTF、KGL、...)です。何回か出現し、より多くの数を持つレベルを保持する(迅速に)除去する(または53レベルのみを保持する)ことができますか?
レベルの名前をすべて書きますか?何回かありますか、より高速な方法がありますか?
train <- train[!train$tip == "KTF", ]
'tbl < - table(train $ tip)'を使用して頻度、すなわち 'サブセット(列レベル(tip)%%名(tbl [tbl> 50 ])) ' – akrun