0

PySparkを使用してモデルをPMMLとしてエクスポートすることは可能ですか?私はこれがスパークを使って可能であることを知っています。しかし、私はPySparkのドキュメントでは何の参考文献も見つけられませんでした。これは、私がこれをやりたければ、サードパーティ製のPython PMMLライブラリを使ってカスタムコードを書く必要があるということですか?PySparkを使用してモデルをPMMLとしてエクスポート

+0

今のpysparkを使用してPMMLsのサポートはありません。 – eliasah

+0

返信ありがとう – SameeraR

+0

@eliasahあなたは私の質問の2番目の部分にいくつかの洞察力を与える? 「これを行うには、サードパーティのPython PMMLライブラリを使用してカスタムコードを記述する必要がありますか? – SameeraR

答えて

2

JPMML-SparkMLライブラリを使用して、Apache SparkパイプラインをPMMLにエクスポートすることができます。さらに、このライブラリはJPMML-SparkML-Packageプロジェクトによって「スパークパッケージ」の形でエンドユーザーに提供されます。

例PySparkコード:

from jpmml_sparkml import toPMMLBytes 
pmmlBytes = toPMMLBytes(sc, df, pipelineModel) 
print(pmmlBytes) 
+0

素晴らしい。これを試してみる。 – SameeraR

+0

@ user1808924 @SameeraR上記のJPMML-SparkML-Packageプロジェクトを使用してPySparkコードからpmmlを生成できましたか? 'java.lang.IllegalArgumentException:Field"ラベルは存在しません。 'pipelineModel = pipeline.fit(df)'これはScalaとPySparkコードの両方に当てはまります。 – mrjoseph

関連する問題