-1

私はこのようになりますスパークSQLのデータフレームがあります。SparkSQLデータフレームの2つの列を結合するにはどうすればよいですか?

df.select("FirstName","F_Name","Dept").show() 

FirstName|F_Name|Dept 
--------------------- 
Alfred |null |c1 
null  |Jarvis|c2 
Jeeves |null |c1 

私はこのようになりますテーブルを持つことができるように、姓とF_NAMEを合体することができるようにしたい:

Name |Dept 
----------- 
Alfred|c1 
Jarvis|c2 
Jeeves|c1 

を私は合体を使用してみましたが機能しませんでした。

df.select("coalesec(FirstName,F_Name) as Name","Dept").show() 

これを実行するPySparkまたはScalaの方法は、いずれも役に立ちます。

ありがとうございます。

答えて

1

coalesce機能を使用すると、

df.select(coalesce(df.col("FirstName"),df.col("F_Name")).alias("Name"), df.col("Dept")).show() 
を探している正確に何である
関連する問題