2017-09-12 6 views
1

私の理解が正しい場合は、一度に1つのストリーム分析ジョブのインスタンスしか実行されません。そして、現在のイベントセットで終了した後、次のイベントセットがイベントハブから取得されます。もしそうなら、逐次的です。Azure Stream Analyticsでの並列処理方法

処理に20ミリ秒かかる場合、他のイベントはその数ミリ秒間待たなければなりません。私はこの一連の操作で生産量が足りるとすればいいのだろうかと思っていましたか?

私はPartitionBy節を認識していますが、IoTハブを使用しているため、partitionId/PartitionKeyを使用することはできません。事前

答えて

1

おかげで、同じデバイスIDを持つすべてのメッセージは、同じpartitionIdに送信されます。クエリで一度に1つのdeviceIdしか表示されない場合でも、partitionIdを使用して各パーティションを個別に処理できます。例としては、Select、Filterのみのクエリ、キーにdeviceidを含む集計などがあります。

クエリで一度に複数のdeviceIdを調べる場合(たとえば、ウィンドウ内のメッセージの合計数をカウントする場合)、2つのオプションがあります。部分集合を最初に並行して実行し、それらを結合してグローバル集合を得ることができます。または、パーティションなしでクエリを使用するだけです。

また、Azureストリーム分析では、メッセージに1つずつメッセージが表示されず、質問で述べたような遅延が発生します。

関連する問題