私はタイムスタンプ列とドル列からなるデータセットを持っています。週ごとの平均ドル数が各行のタイムスタンプで終わるのを見たいと思います。最初はpyspark.sql.functions.window関数を見ていましたが、それは週ごとにデータを格納します。 %pyspark
import datetime
from pyspark.sql import functions as F
df1 =
データを平滑化するためにローリング平均を使用しています。私のdataはhereです。 私の元のデータの図は、 現在、私は import pandas as pd
import numpy as np
data = pd.read_excel('data.xlsx')
data = np.array(data, dtype=np.float)
window_length = 9
res