0
複数の出現および複数の列を含むガーベッジ値しかし、私は複数の列に複数の出現を持つガーベジ・バリュー・フォームの文字列を削除したい。
サンプルコード: -
filter_list = ['$','#','%','@','!','^','&','*','null']
def filterfn(*x):
remove_garbage = list(chain(*[[filter not in elt for filter in
filter_list] for elt in x]))
return(reduce(lambda x,y: x and y, remove_garbage, True))
filter_udf = f.udf(filterfn, BooleanType())
original = original.filter(filter_udf(*[col for col in compulsory_fields]))
original.show()
この例では「オリジナル」は、これは私の配列(これは複数の列として格納する)である私の元のデータフレームと「compulsory_fields」です。
サンプル入力: -
id name salary
# Yogita 1000
2 Neha ##
3 #Jay$deep## 8000
4 Priya 40$00&
5 Bhavana $$%&^
6 $% $$&&
サンプル出力: -
id name salary
3 Jaydeep 8000
4 priya 4000