2016-10-21 18 views
0

現在、20個のフィーチャと400K行のデータセットで作業しています。私はSVMを使用してマルチクラスの分類にe1071ライブラリを使用しています。私はこのコードを持っており、結果を得るのに2日ほどかかります。同じライブラリを使用して時間の複雑さを減らす方法はありますか?私が他のライブラリやオプションをどのようにRで考慮すべきなのでしょうか?SVMの実行時間を短縮する方法

svm.model <- svm(y ~., data = traindata, gamma = 0.01, cost = 10, kernel= "radial") 
+0

1000から10000行のサブサンプリングを試してみて、サンプルの数を減らしてどのようなパフォーマンスが得られるかを見てみましょう。これはまともなモデルを取得するのに十分な情報かもしれません。異なるカーネルも試してみてください。 – zacdav

+0

はい、私はそれを試みました。しかし、データ全体と比較してサイズ40Kのサンプルを取るとき、誤差の差は重要です。 – user2991421

+0

あなたはトレーニング/テスト、クロスフォール検証などを行っていますか? – zacdav

答えて

1

私は、パフォーマンスの向上を与える機能の数を減少させるために(例えばPCA付き)次元削減を試みることをお勧めしたいです。

関連する問題