0
私はRDDに変換するシーケンスデータを持っています。pysparkでウィンドウ操作をスライディングする方法は?
filteredRDD.collect()
[0, 1, 2, 3, 5, 9]
Iデルタ現在の取得したい - 前回値、出力が [1、1、1、2、4]です。
私たちはどのような種類のウィンドウ機能を持っていますか?今、あなたはあなたの望ましい結果がzipWithIndex
であるあなたは、あなたのRDDをzipWithIndex
することができます得るために何ができるか