0

Apache Flinkの文書によると:DataStream TransformationsFlink:なぜ、Reduce、Fold、AggregationsのソースがDataStreamではなくKeyedStreamですか?

倍、集計がDataStreamDataStreamからKeyedStreamDataStreamから代わりにから変換を表しており、削減のすべて。

私は理由を知りたいですか?

は、私の知る限り理解し、あなたはまだmapまたはfilterのように、(非キー)でDataStreamにreduceまたはfoldまたはmin/max(集計)を行うことができます。

答えて

0

通常、いくつかの集計はkeysに基づいて行います。たとえば、ストリーミングの入力がTuple2(groupId:String、userId:String)であるとします。 groupIdをキーとするKeyedStreamをキーとして、APIは各グループのユーザー数をカウントする便利な方法を提供します。

もちろん、すべての入力データに対してグローバルmin userIdを取得したい場合は、単純にDataStreamでmapを使用してそれを実現できます。

関連する問題