2017-06-19 11 views
1

私はZeppelin 0.7.1とspark 2.1.0を使用しています。は、VectorAssembler.transfromの後にZeppelinの他の段落を実行できません

私はデータフレーム「データセット」の一部のデータだVEの

+-------+-------+-------+-------+ 
| index |var 1 |var 2 |var 3 | 
+-------+-------+-------+-------+ 
| 0  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 1  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 2  | 1  | 0  | 1  | 
+-------+-------+-------+-------+ 

をし、私が欲しい、1つのベクトル列にすべての列を置くために、線形回帰をするために:

from pyspark.ml.linalg import Vectors 
from pyspark.ml.feature import VectorAssembler 


assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features') 
output = assembler.transform(dataset) 

これを実行した後は、ツェッペリンで別の段落を実行することはできません。私は通訳を再開しなければなりません... 誰かが問題の原因となる考えがある場合。

ありがとうございます!

答えて

1

バージョン0.7.2のツェッペリンが問題を解決するはずです。 私たちは同じ問題を抱えていました。同じバージョンとこのアップグレードでテストしましたが、それは問題ありませんでした。

について

関連する問題