0
私は参加しようとしている2つのスパークデータセットを持っています。結合キーはデータセットAにネストされているので、まずデータセットBと結合する前にそれをフラット・マップする必要があります。問題は、そのフィールドをフラット・マップすると、列名がデフォルトの "_1"、 "_2"などになります。エイリアスを何とか変更することは可能ですか?それは、各列内の列またはデータ型の数がsame.Thatのままであることを保証するものではありませんflatMap
のような変換を適用した後、またはmap
としてあなたが論理的であるとして、列を失うflatMap
のような変換を適用した後Spark Dataset:フラットマップの後に列のエイリアスを変更する方法は?
A.flatMap(a => a.keys).join(B).where(...)
あなたは、わからないあなたのコードをコピーすることができます –