私のdf1にはDouble型の列があり、df2にはTimestamp型の列があり、df3にはInteger型の列があります。RDDに変換せずに異なる列名とタイプのスパークで複数のデータフレームを結合する方法
df1 = ...
df2 = ...
df3 = ...
val df4 = df1.zip(df2).zip(df3)
しかし「ジップ」のようなそのような機能はありません。
私はこのような何かを達成しようとしています。そのような結果をどのようにアーカイブすることができますか?
何を試しましたか?ドキュメントやIDEで必要な機能を見つけるのに1分です。 –
[ScalaとApache Sparkで2つのデータフレームを結合するにはどうすればいいですか?](https://stackoverflow.com/questions/36800174/how-to-join- –
「可能な重複」は必ずしも重複しているとは限りません。だからこそあなたは近い投票についての情報を持っていて、なぜそれが重複ではないと言うことができるのですか –