2017-09-05 7 views

答えて

1

mlにローカル線形代数を維持する動機は、SPARK-13944で説明されています。

生産展開を簡略化するために、線形代数をスパーク依存性のないスタンドアロンモジュールとして分離します。将来、ローカルモデルを含むかもしれない新しいモジュールmllib-localを呼び出すことができます。 大きな問題は、ユーザー定義型の依存関係を削除することです。

パッケージ名がmllibからmlに変更されます。たとえば、ベクトルはorg.apache.spark.mllib.linalg.Vectorからorg.apache.spark.ml.linalg.Vectorに変更されます。新しいMLパイプラインの戻りベクトルタイプはMLパッケージのものになります。ただし、既存のmllibコードには触れません。その結果、APIが破損する可能性があります。また、ベクトルがSpark SQLによってmllibベクトルからロードされると、ベクトルはmlパッケージのものに自動的に変換されます。今実装はいくつかの変換方法を除く、同じに近い

+0

これは明らかだった、ありがとう! – HBX

関連する問題