内WrappedArraysをマージ:Pysparkは現在Pysparkのデータフレームは、このような構造(col2のWrappedArraysのリスト)を持っているDATAFRAME
:+---+---------------------------------------------------------------------+
|id |col2 |
+---+---------------------------------------------------------------------+
|a |[WrappedArray(code2), WrappedArray(code1, code3)] |
+---+---------------------------------------------------------------------+
|b |[WrappedArray(code5), WrappedArray(code6, code8)] |
+---+---------------------------------------------------------------------+
これは私が持っていると思い構造(col2の平坦化リスト)であります
+---+---------------------------------------------------------------------+
|id |col2 |
+---+---------------------------------------------------------------------+
|a |[code2,code1, code3)] |
+---+---------------------------------------------------------------------+
|b |[code5,code6, code8] |
+---+---------------------------------------------------------------------+
しかし、私はその変換を行う方法がわかりません。私はフラットマップをしようとしましたが、それはうまくいかないようです。助言がありますか?
flatMapを行うには間違った方法です。フラットマップは行を複製します。 try map –