2017-03-22 7 views
0

私はDataframeが不変であることを知っているので、Dataframeの特定の列の値を置換または更新しようとしています。私は、UpdateまたはReplacementではなく新しいDataframeに変換しようとしています。Spark Dataframeで特定の列の複数の値を再現する方法は?

スパークドキュメントで説明したように、私はdataframe.replaceを試してみましたが、それはエラーとして私にエラーを与えている:値置き換えるには、私が試した以下org.apache.spark.sql.DataFrame

のメンバーではありません複数の値を渡すoption.For私は、アレイ

val new_df= df.replace("Stringcolumn", Map(array("11","17","18","10"->"12"))) 

に渡していますが、私は

エラーなどのエラーを取得しています:オーバーロードされたMET代替品を使用したhod値配列

ヘルプは本当にありがとう!あなたが.naを呼び出す必要があり置き換えるなどとしてorg.apache.spark.sql.DataFrameNaFunctionsにアクセスするには

答えて

1

。だからあなたのコードは

import com.google.common.collect.ImmutableMap 

df.na.replace("Stringcolumn", Map(10 -> 12, 11 -> 17)) 

がDataFrameNaFunctionsのすべてのリストを取得するには hereを参照してください、次のようになりますし、それらに

を使用する方法
関連する問題