スパークデータフレームをループする方法はありますか? は私がで構成されていたデータフレームを持っている:スパークデータフレームをループする方法
time, id, direction
10, 4, True //here 4 enters --> (4,)
20, 5, True //here 5 enters --> (4,5)
34, 5, False //here 5 leaves --> (4,)
67, 6, True //here 6 enters --> (4,6)
78, 6, False //here 6 leaves --> (4,)
99, 4, False //here 4 leaves -->()
それは時間でソートされ、今、私はステップスルーし、有効なIDを蓄積したいと思います。 IDSは、その結果RDDこの
time, valid_ids
(10, (4,))
(20, (4,5))
(34, (4,))
(67, (4,6))
(78, (4,)
(99,())
のようになります。私は、これは並列化しないことを知っているが、DFがそれほど大きくない。==真と方向に出る==方向に虚偽
を入力します。では、スパーク/スカラでどうやってこのことができますか?