0
同じIDの行を含むデータフレームがあります。私はここに1つの行(1つのJSON)spark - unionデータフレームの行を1行にする
に同一のIDを持つ全ての行組合に必要 はデータの例である:
id first_name last_name
1 JAMES SMITH
2 MARY BROWN
2 DAVID WILLIAMS
1 ROBERT DAVIS
要求された結果である:
{
id:1,
entities: [{
first_name:JAMES,
last_name:SMITH
}, {
first_name:ROBERT,
last_name:DAVIS
}]
}
{
id:2,
entities: [{
first_name:MARY,
last_name:BROWN
}, {
first_name:DAVID,
last_name:WILLIAMS
}]
}
缶それは行われる?
よろしく、Yaniv
は 'その使用をcollect_list'andを認識していません、ありがとう。 – Shankar
あなたの答えは、 ありがとうTzachありがとう、コードを実行しようとすると例外が発生します: 'AnalysisException:未定義関数collect_list' –
ああ、私はあなたが' 'org.apache.spark" %% " (org.apache.spark "%%" spark-sql "'に加えて)依存関係の中で、この関数の実装がSparkのHiveサポートにあるため、「spark-hive」を使用しています... –