2
私はSpark 2.1とpython 2.7.12を使用します。DataFrameで具体的なタイムスタンプを指定しないで値を入力する方法はありますか?
from pyspark.sql.functions import *
import timestamp
data = [Row(time=datetime.datetime(2017, 1, 1, 0, 0, 0, 0)), Row (time=datetime.datetime(1980, 1, 1, 0, 0, 0, 0)), Row(time=None) ]
df = spark.createDataFrame(data)
どのように特定の時間にnull
値/秒を埋めるためにdf.fillna({'time': datetime.datetime(1980, 1, 1, 0, 0, 0, 0)})
を使用する:
は以下と仮定しますか?