2016-04-25 9 views
0

私は銀行の名前、場所、その他いくつかのフィールドも持っています。私は最大の支店を持つ銀行を探したい。Pig ::グループの個数から最大値を取得

A = LOAD 'bank.txt'; 
B = GROUP A by $0; 
C = FOREACH B GENERATE COUNT($1); 

私は銀行賢明にカウントします。今私はCを参照して、MAXブランチを持つ銀行を取得する方法に固執しています。

答えて

1

あなたはBankでグループ化しているので、グループ化を生成し、ブランチを表すフィールドをカウントし、count descで順序付けし、一番上の行を取得する必要があります。

A = LOAD 'bank.txt'; 
B = GROUP A by $0; 
C = FOREACH B GENERATE group as Bank,COUNT(B.Branches_Field) cnt; 
D = ORDER C BY cnt DESC; 
E = LIMIT D 1; 
DUMP E; 
関連する問題