私は次のことを行いUDFを作成したいと思います:他の列への参照として値を持つUDFを書き込む方法はありますか?
DataFrame
は5列があり、その値は、第1および第2の列名が含まれている合計で6番目の列を作成したいと。
私はDataFrame
を印刷し、それを説明しましょう:
case class salary(c1: String, c2: String, c3: Int, c4: Int, c5: Int)
val df = Seq(
salary("c3", "c4", 7, 5, 6),
salary("c5", "c4", 8, 10, 20),
salary("c5", "c3", 1, 4, 9))
.toDF()
DataFrame
結果
+---+---+---+---+---+
| c1| c2| c3| c4| c5|
+---+---+---+---+---+
| c3| c4| 7| 5| 6|
| c5| c4| 8| 10| 20|
| c5| c3| 1| 4| 9|
+---+---+---+---+---+
df.withColumn("c6",UDFName(c1,c2))
そして、この列の結果は次のようになります。
1º行(C3、C4)次に7 + 5 = 12
2度行(C5、C4)次に2 0 + 10 = 30
3º行(C5、C3)、そして9 + 1 = 10
あなたが聞いた質問に対する回答を[受け入れる](https://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work)と考えてください。 – Shaido