Spark Structured Streamingでの複数の集計

Spark Structured Streamingで複数の集計を行いたいとします。Spark Structured Streamingでの複数の集計

このような何か：

これを構造化ストリーミングで実行すると、「複数のストリーミング集約がストリーミングデータフレーム/データセットでサポートされていません」というエラーが表示されます。

ストラクチャードストリーミングでこのような複数の集計を行う方法はありますか？

2016-12-07 Kaptrain

低レベルの 'DStream'抽象化を試しましたか？ –

私は、構造化ストリーミング（データセット/データフレーム）を使用したいと考えていました。 DStreamで同様のことが行われているいくつかの例を教えてください。 – Kaptrain

ストラクチャードストリーミングAPIはまだ実験的なので、これはSpark 2.0ではサポートされていません。すべての現在の制限事項のリストについては、hereを参照してください。

2016-12-07 07:33:21

私はこれをチェックしています。私はそれが動作すると思う。ありがとう！ – Kaptrain

これは、構造化ストリーミングAPIのサポートが不足しているため、今のところ行く方法です。 – Kaptrain

これはサポートされていませんが、他の方法もあります。単一の集計を実行し、それをkafkaに保存するように。それをkafkaから読んで、集約を再度適用してください。これは私のために働いています。

2017-08-04 03:00:08

答えて