spark mllibとspark mlのベクトル実装の違いは何ですか？

高レベルでは、Spark MLLibはRDDの上に書かれ、Spark MLはDataFramesの上に構築されていますが、私の理解は詳細には欠けています。spark mllibとspark mlのベクトル実装の違いは何ですか？

特に、さまざまなベクター実装の互換性がないと、実装の違いとその理由は何ですか？

2017-09-05 HBX

mlにローカル線形代数を維持する動機は、SPARK-13944で説明されています。

生産展開を簡略化するために、線形代数をスパーク依存性のないスタンドアロンモジュールとして分離します。将来、ローカルモデルを含むかもしれない新しいモジュールmllib-localを呼び出すことができます。大きな問題は、ユーザー定義型の依存関係を削除することです。

パッケージ名がmllibからmlに変更されます。たとえば、ベクトルはorg.apache.spark.mllib.linalg.Vectorからorg.apache.spark.ml.linalg.Vectorに変更されます。新しいMLパイプラインの戻りベクトルタイプはMLパッケージのものになります。ただし、既存のmllibコードには触れません。その結果、APIが破損する可能性があります。また、ベクトルがSpark SQLによってmllibベクトルからロードされると、ベクトルはmlパッケージのものに自動的に変換されます。今実装はいくつかの変換方法を除く、同じに近い

、

出典

2017-09-05 14:00:18 user8371915

これは明らかだった、ありがとう！ – HBX

spark mllibとspark mlのベクトル実装の違いは何ですか？

答えて

関連する問題