これはDFです:2つの異なる列に列を分割する方法は?
org.apache.spark.sql.DataFrame = [year_artist: string, count: bigint]
df.show()を返します。
+--------------------+-----+
| year_artist|count|
+--------------------+-----+
| 1945_Dick Haymes| 5|
|1949_Ivory Joe Hu...| 1|
| 1955_Tex Ritter| 1|
は、私は2つの別々に最初の列を分割する必要があります年、アーティスト 私はこのSpark map dataframe using the dataframe's schemaのようなものを考えています、しかし、私の実現には、次のことは動作しません
df.rdd.map(row => (row(0).getAs[String].split("_")(0), row(0).getAs[String].split("_")(1)))
RDDに変換せずにそれを作る方法がありますか?