2016-08-08 9 views
2
(ABC,****,tool1,12) 
(ABC,****,tool1,10) 
(ABC,****,tool1,13) 
(ABC,****,tool2,101) 
(ABC,****,tool3,11) 

をタプルの比較に続いて、入力データは、上記の豚のフィールドに基づいて

ある豚の私のデータセットです。

スキーマは次のとおりです。ユーザー名、IP、ツール、期間

私は同じツール

出力の期間を追加

(ABC,****,tool1,35) 
(ABC,****,tool2,101) 
(ABC,****,tool3,11 

答えて

1

利用GROUP BYとでSUMを使用したいです期間。

A = LOAD 'data.csv' USING PigStorage(',') AS (Username:chararray,ip:chararray,tool:chararray,duration:int); 
B = GROUP A BY (Username,ip,tool); 
C = FOREACH B GENERATE FLATTEN(group) AS (Username,ip,tool),SUM(A.duration); 
DUMP C; 
関連する問題