0
ここでは私のサンプルデータテーブルはハイブ:複数の条件に基づいて、重複排除データ
row# date customerid event itemid-A Itemid-B
1 5/1/17 4c9b3705121ac1493640912601 page load 473685
2 5/1/17 11dacfc4251da01493672636536 page load 863438
3 5/1/17 11dacfc4251da01493672636536 click 863438 45485
ある条件#1:私は、行の#3との重複顧客ID以来、行#2のフォームにデータを削除する必要があります。基本的にページロードイベントを削除し、顧客IDが重複している場合はクリックイベントを維持します。クリックイベントはユニークなItemid-Bを持つ
条件2:重複するcustomeridがない場合は、ロー1にページロードイベントを保持する必要があります。