2017-12-07 5 views
0

私は1つの列と他の多くの列が含まスパークスカラのサンプルデータフレームを有する50+とIDを展開する必要がありますスペース区切りの列をどのように爆発させるのですか?

例えばデータ:

id    name address 
234 435 567 auh aus 
345 123  muji uk 

出力データ:

id    name address 
234   auh aus 
435   auh aus 
567   auh aus 
345   muji uk 
123   muji uk 

を誰か助けてもらえますか?

答えて

2

これを試してみてください:

import org.apache.spark.sql.functions._ 

scala> df.withColumn("id", explode(split($"id", " "))).show 
+---+----+-------+ 
| id|name|address| 
+---+----+-------+ 
|234| auh| aus| 
|435| auh| aus| 
|567| auh| aus| 
|345|muji|  uk| 
|123|muji|  uk| 
+---+----+-------+ 
関連する問題