0
JSONオブジェクトを含むデータフレームにカラムがあります。私のデータフレームの各行について、JSONを抽出して解析し、特定のフィールドを取り出したいと思います。一旦抽出されると、新しい列要素として行にフィールドを追加したいと思います。Explode Spark JSONを含むDataframeカラム
私は、データフレーム上で利用できるだけでなくforeach()
、flatMap()
とmap()
が、この種の処理に適している識別することができていないようexplode()
方法を見てきました。
David、チップのおかげで。マップは1:1であるにもかかわらず、行の長さが一貫していると予想されますか? – dmux
出力行は、入力行と同じ長さである必要はありません。しかし、データフレームでは、すべての行が同じフィールドを持たなければなりません(出力行はすべて同じ構造でなければならず同じ長さでなければなりません) – David
最初に 'RDD'に' map'して変換しませんか? 'withColumn'と' UDF'を使うだけで変換をスキップすることができます。 –