を特殊文字を削除する:私は次のようなデータセットを持っているデータフレームの列から
! Hello World. 1
" Hi there. 0
私が何をしたいのか、ちょうどから(各行の先頭からすべての特殊文字を削除することです残りの特殊文字ではありません)。データを読み出すために
(タブ区切り)私は、次のコードを使用します。私はreplaceAll()
を使用する必要があることを承知していますが、私はそれを行う方法はかなりわからない
val data = sparkSession.read.format("com.databricks.spark.csv")
.option("delimiter", "\t")
.load("data.txt")
val columns = Seq("text", "class")
val df = data.toDF(columns: _*)
を。