データのクリーニング、プリプロセンス、およびいくつかの異なるモデル(例:R Studio)での実験をしてから、ソリューションを現実的に展開するにはどうすればよいですか。 モデルがシンプルなモデル、例えばデシジョンツリー、ロジスティック回帰モデルであり、モデルが明白であり、R Predictorモデルがhttpエンドポイントなどの商用Rサーバーにデプロイされているのは簡単です。複雑な機械学習予測プログラムをどのように導入すればよいですか?
私の質問は、 (例えば、PCA変換、RBFカーネル、または100個のツリーのランダムフォレスト)を使用している場合は、Rスクリプトを事前処理し、PCAを適用したり、RBF事前処理スクリプトなどをデプロイメントサーバーに適用しなければならない?
これはRBFの意味ですか私のSVMプレディクタと一緒にすべての元のトレーニングデータセットをホストする必要がありますか? RBF変換はトレーニングセットまたは少なくともサポートベクトルの関数である。
ランダムフォレストの場合、非常に大きなモデルの一部として、500台ほどのツリーをアップロードする必要があると仮定します。
ありがとう、便利です。私は、PMMLがモデルや前処理機能を表現できることがわかります。そしてそれはランダムフォレストからの100sまたはTreesをサポートするためにスケールするでしょう。私はRBF(もっと勉強する必要があります)に少しばかげていると思いますが、RBKカーネルの変換はトレーニングセットのデータの機能であり続けていると思いました。 RBFカーネル変換を導入するには、トレーニングセットをPredictorデプロイメントに配布する必要があります。 – user2129049
RBFカーネルでSVMをトレーニングする: 'rbfSvm = e1071 :: svm(..、kernel =" radial "、..)';次にPMMLにエクスポートする: 'pmml(rbfSvm)'。あるいは、あなたのRコードの一部を表示して、それをPMML化する最も簡単な方法を分析することができますか? – user1808924