私はスパークストリーミングを始めました。 UpdateStateByKey操作の重要性を理解しようとしていますか?それの使用は何ですか?任意国家を保管する必要性は何ですか?使い方?updatestatebykey - Pyspark - スパークストリーミング
0
A
答えて
1
updateStateByKey
メソッドを使用すると、ストリームからのデータに基づいて状態情報を作成できます。
たとえば、与えられたsensor_idの現在のステータス(風速、気温など)を(sensor_id, (timestamp, values))
の形式で送信している気象センサがある場合、updateStateByKeyを使用して、センサーの現在の気象状態を表すストリームを作成できます。 [(sensor_1, current_weather_data), (sensor_2, current_weather_data)]
。
他のデータとストリームを結合することができます。センサーが最後のウィンドウで情報を送信しなくても、状態には最後の値が含まれます。私はthis notebookでこの方法を使用しました。
関連する問題
- 1. Spark Streaming - updateStateByKeyとキャッシュデータ
- 2. スパークストリーミング - バイナリデータファイルの処理
- 3. カフカ+スパークストリーミング:kafka.common.OffsetOutOfRangeException
- 4. EMRとS3ソース上でスパークストリーミング
- 5. スパークストリーミング重複ネットワークコール
- 6. JSONのUpdateStateByKey SparkのKafkaのデータ
- 7. Apacheのスパークは、(updateStateByKey後にマージ)
- 8. スパークストリーミングMYSQL
- 9. スパークストリーミングJavaCustomReceiver
- 10. スパークストリーミングrawSocketStream
- 11. to.JSON()スパークpyspark
- 12. スパークストリーミングがDstream
- 13. スパークストリーミングのバッチルックアップデータ
- 14. スパークストリーミング - java.lang.NoSuchMethodErrorエラー
- 15. スパークストリーミング:Print JavaInputDStream
- 16. Fitbitデータ用スパークストリーミング
- 17. スパークストリーミングkafka concurrentModificationException
- 18. スパークストリーミング保留バッチ
- 19. スパークストリーミング:ソースHBase
- 20. スパークストリーミングhbaseエラー
- 21. スパークストリーミングJavaPairDStreamをテキストファイル
- 22. スパークストリーミング:java.lang.NoClassDefFoundError:kafka/api/TopicMetadataRequest
- 23. スパークストリーミングHiveContext NullPointerException
- 24. スパークストリーミングKafka java.lang.ClassNotFoundException:org.apache.kafka.common.serialization.StringDeserializer
- 25. スパークストリーミングxmlファイル
- 26. スパークストリーミングとHbase
- 27. スパークストリーミング - 動的フィルタ
- 28. スパークストリーミング再生
- 29. Javaスパークストリーミングとキャッサンドラ
- 30. カフカストリーミング+スパークストリーミング+マシンラーニング