私がどのように見えるのdfのデータフレームを呼び出した場合:DF2がどのように見えるだろうとDataFrame.withColumnでは、2番目のパラメータの条件として列の値を使用するにはどうすればよいですか?
val df2 = df.withColumn("a1", when($"a1" == "N/A", $"a2))
:
+---+---+
| a1+ a2|
+---+---+
|foo|bar|
|baz|baz|
+---+---+
ではなく、私が手に:私はから期待
+---+---+
| a1+ a2|
+---+---+
|foo|bar|
|N/A|baz|
+---+---+
を
error: type mismatch;
found : Boolean
required: org.apache.spark.sql.Column
DataFrameのwithColumnメソッド内で値を生成するColumnメソッドが必要なようです。
withColumnの置換パラメータに条件付きで現在の列の値を設定するなどの方法はありますか?
3秒でそれにあなたを打つ@psidom ...:O –
@TzachZoharだけ私はいつもSpark REPLを稼働させておくべきだということを示しています。そのスタートアップ時間はすべての違いをもたらしたでしょう! –
あなたにおかげで両方のおかげで - ボーナスの質問、どのように来る=== nullは動作していないようですか? – yoel