予測モデルに使用したいデータをcsv形式で使用しています。私はRのデータを読んで、単純な前処理(NAを付けないなど)を適用します。私がSVM分類器を訓練する前に、scale(x)関数を使ってデータを拡大縮小したいと思っています。問題は、ラベル列がデータセットの一部であることです。 Rにその列を無視するように指示するにはどうすればよいですか?ここでベストプラクティスは何ですか?特定の列を無視してRでデータをスケーリングする
label, X1, X2, X3, ..., Xn
Y, 34, 74, 29, ..., 47
N, 88, 46, 95, ..., 33
N, 58, 78, 25, ..., 68
Y, 33, 56, 61, ..., 13
は私がしようとした場合:
x <- scale(trouble[,-c(1)])
trouble <- x
summary(trouble)
rm(x);
最初の列が削除され、良いのために行っています。