2017-09-09 9 views
1

Azureイベントハブにはスケーラビリティのためのパーティション機能があります。 appサービスを使用してデータを読み取る際に、1つのeventprocessorHostを1つのパーティションに限定することができます。複数のパーティションからのデータを一括して処理する方法はありません。 しかし、ストリーム分析を使用している間は、時間に基づいてデータを集計できます。では、データを集約しながらすべてのパーティションを管理しますか?つまり、読み取りが8つのパーティションに渡された場合、集計にはこれらのすべての読み取り値が計算に含まれている必要があります。 ありがとうAzureストリーム解析は、すべてのパーティションからのデータを読み込みますか?

答えて

0

はい。 documentationに基づいて、いくつかのシナリオがあります。あなたのクエリがパーティション化されていることを確認する必要があります

出力は別のイベントのハブのように、同様のサポート・パーティショニングを行い

は、あなたがしてパーティションを使用することができます。これには、すべての手順でPartition Byを使用する必要があります。複数のステップが許可されていますが、すべて同じキーでパーティション化する必要があります。現在、ジョブを完全に並列化するには、パーティション化キーをPartitionIdに設定する必要があります。

出力にパーティション化(Power BIなど)がサポートされていない場合、元のパーティションデータを取り込まずにデータが読み込まれます(したがって、すべてのパーティションから読み込まれます)。

0

partitionid by partitionidを使用しないと、すべての入力パーティションのデータが集約前にマージされます。イベントの発注は、タイムスタンプ(到着または申請)に基づいて行われます。これは、1つのパーティション内にデータがないと結果をブロックできないことを意味します。ブロックする時間は、遅い到着ウィンドウによって制御されます。

[このページ](https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-out-of-order-and-late-events)には、遅延到着ウィンドウの詳細と例があります。

関連する問題