2
Spark 1.6.1、Scala api。Spark "0を0に置き換える"性能比較
データフレームでは、特定の列のすべてのNULL値を0に置き換える必要があります。 これを行うには2つの方法があります。 1.
myDF.withColumn("pipConfidence", when($"mycol".isNull, 0).otherwise($"mycol"))
2.
myDF.na.fill(0, Seq("mycol"))
彼らは本質的に同じまたは1つの方法が望ましいですか?
ありがとうございました!