0
比較的大量のデータ(150M)に対してSVM分類(バイナリ応答あり)を実行したい。そこで、私はトレーニングデータセット(約50,000と言う)をサンプリングし、svm{e1071}
をR
に使ってモデルを構築しました。今度は、その結果をデータセット全体に適用したいと考えています。 R
にこのような大きなデータセットをロードして実行する方法がわかりません。ですから、R
からモデルパラメータを抽出し、別のプラットフォームで実行する必要があります。言い換えれば、私は、全体のデータに対して同じweight.svm
(確率)を取得したい:大量のデータのSVM予測
model.svm = svm(as.factor(response) ~.,data=predictors, probability=TRUE)
predict.svm= predict(model.svm,predictors,probability=TRUE)
weight.svm = data.frame(attr(predict.svm,"probabilities"))
任意の提案? SVMでこの予測関数がどのように機能するかを示す簡単なテキスト/参照はありますか?どの値をmodel.svm
オブジェクトから抽出すればよいですか? model.svm$SV
など?
PMMLについては、https://support.zementis.com/entries/21197842-PMML-Export-Functionality-in-R-Supported-Packagesを参照してください。私はこの会社には歴史がなく、それを保証することはできませんが、さまざまなモデルの構造をエクスポートし、そのモデルで予測を行うことができると主張しています。 –