1
48個の異なる列を含むSpark DataFrame、train_tbl
があります。 sparklyr
パッケージを使用してランダムなフォレストモデルを訓練し、response
という変数とfeatures
という他のすべての列として48列のうちの1つを使用します。 473のフィールド名をすべて入力せずに、loan_status
以外のすべてのフィールドをフィーチャーとして使用するように指定する方法はありますか?sparklyr:トレーニングモデルのレスポンス以外のすべての列を選択します。
ml_random_forest(x = train_tbl,
response = "loan_status",
features = call all fields EXCEPT "loan_status",
num.trees = 10L,
type = "classification")
が、あなたは間違いなく正しい方向に私を導いた...私はfeatures' 'のためにあなたの構文で開始し、働い以下にそれを編集した:' COLNAMES(train_tbl%> %select(-loan_status)) ' – bshelt141
私の答えを更新しました。角括弧は名前の外にある必要があります()。今すぐ働かなければならない。 – waskuf