1
私のデータフィールドのフォーマットは次のとおりです:2016-10-15 00:00:00 私のデータを寄木張りファイルに保存している間に推論スキーマを使用した後、このフォーマットに従う。PySparkの削除カラムの無効な日付時刻フォーマット
どのようにまとめてPySparkで削除できますか?
私のUDFでは問題が発生しています。あなたは無効な日付と日付の列と行を解析していると仮定すると、
私のデータフィールドのフォーマットは次のとおりです:2016-10-15 00:00:00 私のデータを寄木張りファイルに保存している間に推論スキーマを使用した後、このフォーマットに従う。PySparkの削除カラムの無効な日付時刻フォーマット
どのようにまとめてPySparkで削除できますか?
私のUDFでは問題が発生しています。あなたは無効な日付と日付の列と行を解析していると仮定すると、
は通常の場合である、ヌルです:あなたの日付は文字列として読まれている場合、
df.filter(col('date').isNotNull())
また、あなたはunix_timestamp
を使用してそれを解析することができます:
(
df
.select(unix_timestamp('date', 'yyyy-MM-dd HH:mm:ss').cast("timestamp").alias('date'))
.filter(col('date').isNotNull())
)
コードを投稿してください。 – user7337271