1
私は何百ものグループが生成されているので、それらを調べることを避けようとしています。このために、私はそれらを数え、それらを注文してから上位5つの結果に限定します。豚でトップ5の結果の外に「その他」の数をつける
counts = foreach (group distinctVals by (description)) generate group, COUNT_STAR(distinctVals) as count;
ordered = order counts by count desc;
limited = limit ordered 5;
dump limited;
しかし、私は「5トップ」と単に他と呼ばれるグループとしてビンにそれらをしなかったどのように多くの結果の別の数を持っていると思います。
だから私の出力は
(John ,38436)
(Steve ,13654)
(Sarah ,9334)
(Rick ,3241)
(Morty ,784)
(Other ,3421)
ありがとうございます!病気はそれを行ってください。 – Pxl