ストリーム(または要素の長いリスト、数千または数百万になる可能性があります)を持っています。グループの平均。効率的な方法で最初のN個の結果をグループ化、並べ替え、返す
{groupId: 1, value: 10}, {groupId: 2, value: 4}, {groupId: 1: value: 2}
とフォームグループ:
{groupId: 1, average: 6}, {groupId: 2: average}
明らかにナイーブな溶液は、グループを反復平均でソートグループ及び第24グループを返すことである形態である項目がそう。何百万ものアイテムを扱うことができる高性能ソリューションのアイディアですか?
グループを平均でソートする場合は、リスト全体を反復処理する方法はありません。しかし、 "何百万"でも、これは大きな問題ではありません。 –
Hmm。あなたはそれがどのような種類のデータであるかは分かりませんでした。おそらくApache SparkやApache Stormのようなマイクロバッチ処理アプリを使用することができます。 –
@CaptainFogettiこのデータはLuceneインデックスに由来しています。私はユースケースでLuceneコレクタを実装しようとしています。 – agori