SparkMLモデルがSparkクラスターでトレーニングされたら、訓練されたモデルをどのように使って、安らかなAPIを使ってスコアリングすることができますか?リアルタイムWebサービスとしてSparkMLモデルを操作するにはどうすればよいですか?
問題は、ロードするためにSparkContextが必要ですが、実際には必要ないように見えるか、またはSparkContextを作成するために最低限必要なものがあるためです。
SparkMLモデルがSparkクラスターでトレーニングされたら、訓練されたモデルをどのように使って、安らかなAPIを使ってスコアリングすることができますか?リアルタイムWebサービスとしてSparkMLモデルを操作するにはどうすればよいですか?
問題は、ロードするためにSparkContextが必要ですが、実際には必要ないように見えるか、またはSparkContextを作成するために最低限必要なものがあるためです。
場合によっては可能です。
Sparkの多くのモデルは、MLモデルの標準形式であるJPMMLにエクスポートできます。次に、他のJavaライブラリと同じように使用できますhttps://github.com/jpmml/jpmml-sparkml
エクスポートする方法は、Spark ml and PMML exportです。
あなたはまた、しかし、それは連続処理モードは、このような推奨アルゴリズムとしては非常に時間のかかる計算については、
利用可能になるまでより長い待ち時間を持つことになり、値を計算するためにスパークストリーミングを使用することができ、それは私が前に非常に正常だと思います値を計算し、カッサンドラのようなデータベースに保存する
どのアルゴリズムを使用しますか? –
この前の質問を見ることができます:https://stackoverflow.com/questions/40533582/how-to-serve-a-spark-mllib-model – Shaido