1
私はそのようなテーブルがあります、この表の時間に基づいて累積値を得る方法は、pyspark SQLを使用しますか?
、特定の歌手の略artist_id
をDs
は(2015月1日から4月の終わりまで)の日付であるとlike
はどのように多くの人々でありますこの特定の日にこの歌手の曲が好きだった。 累積値like
を取得したいとします。たとえば、20150303日に20150301と20150302、20150303の元の値が加算されます。 どうすればできますか?
groupBy'Ds 'となり、合計は1日のデータの合計しか得られませんが、1日前と今日の前日のデータを合計します。 –
が答えを更新しました。 – vinay
申し訳ありませんが、あなたの更新された回答が表示されません.... –