2
c = df[df['CUSTOMER_EMAIL_ID'].isin(d.CUSTOMER_EMAIL_ID)]
PySparkで同じ表現を書き込む方法は?Pysparkで2つのデータフレームを比較する方法
c = df[df['CUSTOMER_EMAIL_ID'].isin(d.CUSTOMER_EMAIL_ID)]
PySparkで同じ表現を書き込む方法は?Pysparkで2つのデータフレームを比較する方法
あなたは、私はあなたの質問は具体的には、semi joinを使用して答えることができると思い、「私にCUSTOMER_EMAIL_ID
フィールドがd
にCUSTOMER_EMAIL_ID
フィールドから一致する値を持つdf
からすべての行を与える」求めている場合:
c = df.join(b, 'CUSTOMER_EMAIL_ID', 'leftsemi')
左(右)セミ結合は、概念的にはインナー結合として考えられ、続いて右(左)の列が削除されます。
何をしたいですか?もっと詳しく説明できますか?あなたは比較したいのですか、存在するかどうかチェックしますか? –