1
私はZeppelin 0.7.1とspark 2.1.0を使用しています。は、VectorAssembler.transfromの後にZeppelinの他の段落を実行できません
私はデータフレーム「データセット」の一部のデータだVEの:
+-------+-------+-------+-------+
| index |var 1 |var 2 |var 3 |
+-------+-------+-------+-------+
| 0 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 1 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 2 | 1 | 0 | 1 |
+-------+-------+-------+-------+
をし、私が欲しい、1つのベクトル列にすべての列を置くために、線形回帰をするために:
from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssembler
assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features')
output = assembler.transform(dataset)
これを実行した後は、ツェッペリンで別の段落を実行することはできません。私は通訳を再開しなければなりません... 誰かが問題の原因となる考えがある場合。
ありがとうございます!