これをRからPysparkに書き直したいと思います。 pysparkでPysparkデータフレーム演算子「IS NOT IN」
array <- c(1,2,3)
dataset <- filter(!(column %in% array))
これをRからPysparkに書き直したいと思います。 pysparkでPysparkデータフレーム演算子「IS NOT IN」
array <- c(1,2,3)
dataset <- filter(!(column %in% array))
あなたはこのようにそれを行うことができます。
array = [1, 2, 3]
dataframe.filter(dataframe.column.isin(*array) == False)
df_result = df[df.column_name.isin([1, 2, 3]) == False]
わずかに異なる構文と "日付" データセット:
toGetDates={'2017-11-09', '2017-11-11', '2017-11-12'}
df= df.filter(df['DATE'].isin(toGetDates) == False)