1
私はこのようなデータフレームを持っている:pysparkのデータフレームのすべての列を爆発させる方法は?
+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+
| brand| diesel| e10| e5| houseNumber| id| isOpen| lat| lng| name| place| postCode| street| Datum|
+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+
|[TOTAL, ARAL, She...|[1.049, 1.029, 1....|[1.249, 1.209, 1....|[1.269, 1.229, 1....|[49, 12-14, , , ...|[4409a024-b190-4b...|[true, true, true...|[50.93128, 50.952...|[6.962356, 6.9616...|[TOTAL KOELN, Ara...|[KOELN, Köln, KOE...|[50676, 50668, 50...|[HOLZMARKT, Riehl...|2016-08-01 10:50:...|
+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+--------------------+
基本的にすべての列が配列されています。これはネストされたJSONデータに基づいています。 私はそれを爆発させようとしました。しかし、これはselect文の1つの列でのみ可能です。関係が維持されるように、すべての値を一度にどのように解凍してpyspark
にすることができるのか、あなたは知っていますか?