1

いくつかのルールに基づいて、pysparkデータフレームからいくつかの値を選択しようとしています。 pysparkで例外が発生しました。pysparkデータフレームのフィルタリング

from pyspark.sql import functions as F 

df.select(df.card_key,F.when((df.tran_sponsor = 'GAMES') & (df.location_code = '9145'),'ENTERTAINMENT').when((df.tran_sponsor = 'XYZ') & (df.location_code = '123'),'eBOOKS').when((df.tran_sponsor = 'XYZ') & (df.l_code.isin(['123', '234', '345', '456', '567', '678', '789', '7878', '67', '456'])),'FINANCE').otherwise(df.tran_sponsor)).show() 

次の例外が発生しています。あなたはいくつかの提案を与えることができますか?私はちょうど考え出しまあ

File "", line 1 df.select(df.card_key,F.when((df.tran_sponsor = 'GAMES') & (df.location_code = '9145'),'ENTERTAINMENT').when((df.tran_sponsor = 'XYZ') & (df.location_code = '123'),'eBOOKS').when((df.tran_sponsor = 'XYZ') & (df.l_code.isin(['6001', '6002', '6003', '6004', '6005', '6006', '6007', '6008', '6009', '6010', '6011', '6012', '6013', '6014'])),'FINANCE').otherwise(df.tran_sponsor)).show() ^ SyntaxError: invalid syntax

答えて

2

は、問題が代入演算子:(それがうまく機能

df.select(df.card_key,F.when((df.tran_sponsor == 'GAMES') & (df.location_code == '9145'),'ENTERTAINMENT').when((df.tran_sponsor == 'XYZ') & (df.location_code == '123'),'eBOOKS').when((df.tran_sponsor == 'XYZ') & (df.l_code.isin(['123', '234', '345', '456', '567', '678', '789', '7878', '67', '456'])),'FINANCE').otherwise(df.tran_sponsor)).show() 

、誰かがそれに探していた場合の努力に感謝していましたISINのもので問題ありません。

関連する問題