0
生年月日/生年月日の組み合わせごとに2倍と3倍の数を合計します。ほとんどのダブルスとトリプルを持つ選手を生み出した上位5個のbirthCity/birthStateの組み合わせを出力します。豚のスクリプト内の袋の合計
現在、私はこの
clean = FOREACH filtered_2 GENERATE id,city,state, dble + tripple AS combined;
dump clean;
私の疑問を持っているが、私は上記に適合しない方法ですか?それは私が(都市、州)でグループ化しなければならないことは明らかです。どのように私は
counter = foreach clean {
sum1 = SUM(combined);
generate id,city,state,sum1;
};
でグループをすれば、私はこのような何かを考えていたけど、それは
最後の行を説明できますか? PLZはこの特定の関数でどのようにフラット化されたのか混乱しています – dedpo
グループ化は2つのフィールドで行われるので、2つのフィールドでグループ化するとタプルが発生します。タプルからフィールドを抽出するには、FLATTEN –