0
私は銀行の名前、場所、その他いくつかのフィールドも持っています。私は最大の支店を持つ銀行を探したい。Pig ::グループの個数から最大値を取得
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE COUNT($1);
私は銀行賢明にカウントします。今私はCを参照して、MAXブランチを持つ銀行を取得する方法に固執しています。
私は銀行の名前、場所、その他いくつかのフィールドも持っています。私は最大の支店を持つ銀行を探したい。Pig ::グループの個数から最大値を取得
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE COUNT($1);
私は銀行賢明にカウントします。今私はCを参照して、MAXブランチを持つ銀行を取得する方法に固執しています。
あなたはBankでグループ化しているので、グループ化を生成し、ブランチを表すフィールドをカウントし、count descで順序付けし、一番上の行を取得する必要があります。
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE group as Bank,COUNT(B.Branches_Field) cnt;
D = ORDER C BY cnt DESC;
E = LIMIT D 1;
DUMP E;