Seq[String]
とString
として格納されたlistA
とvalB
の2つの列を持つデータフレームがあります。CASE文で配列型の列値を使用する方法
val dfWithAdditionalColumn = df.withColumn("valC", when($"listA".contains($"valB"), 1).otherwise(0))
しかし、スパークは、これを実行に失敗し、次のエラーを与えた:私は、次の操作を実行しようとした私は、int型のものであろう3列目valC
を、作成したいと、その値は
iff valB is present in listA then 1 otherwise 0
です:
cannot resolve 'contains('listA', 'valB')' due to data type mismatch: argument 1 requires string type, however, 'listA' is of array type.;
CASE文でどのように配列型の列値を使用しますか?
おかげで、 Devj