2017-01-01 27 views
1

私のデータフィールドのフォーマットは次のとおりです:2016-10-15 00:00:00 私のデータを寄木張りファイルに保存している間に推論スキーマを使用した後、このフォーマットに従う。PySparkの削除カラムの無効な日付時刻フォーマット

どのようにまとめてPySparkで削除できますか?

私のUDFでは問題が発生しています。あなたは無効な日付と日付の列と行を解析していると仮定すると、

+1

コードを投稿してください。 – user7337271

答えて

0

は通常の場合である、ヌルです:あなたの日付は文字列として読まれている場合、

df.filter(col('date').isNotNull()) 

また、あなたはunix_timestampを使用してそれを解析することができます:

(
    df 
    .select(unix_timestamp('date', 'yyyy-MM-dd HH:mm:ss').cast("timestamp").alias('date')) 
    .filter(col('date').isNotNull()) 
) 
関連する問題