私はSpark Structured Streamingでバックプレッシャ機能を分析しています。誰もが詳細を知っていますか?プロセス受信レコードをコードでチューニングすることは可能ですか? ありがとうSpark Structured Streamingが背圧を処理する方法は?
4
A
答えて
3
ストラクチャードストリーミングで各内部バッチのサイズを動的に変更する場合は、NOです。ストラクチャードストリーミングにはレシーバベースのソースはありませんので、まったく必要ありません。別の観点から見ると、Sparkは他のアプリケーションにデータをKafkaにプッシュする速度を遅くするように指示できないため、構造化ストリーミングは実際のバックプレッシャーを行うことができません。
一般に、Structured Streamingは、デフォルトでできるだけ早くデータを処理しようとします。ファイルソースにはmaxFilesPerTrigger
、カフカソースにはmaxOffsetsPerTrigger
など、処理速度を制御できるオプションが各ソースに用意されています。詳細については、以下のリンクを読む:
http://spark.apache.org/docs/latest/structured-streaming-programming-guide.html#input-sources http://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html
+0
ありがとうございます。 –
関連する問題
- 1. Spark Structured Streamingでバイナリデータを処理する
- 2. Hbase統合によるSpark Structured Streaming
- 3. Apache Spark(Structured Streaming):S3チェックポイントのサポート
- 4. Spark Structured Streamingでの複数の集計
- 5. kafka connect 0.10とSpark Structured Streamingでfrom_jsonを使用するには?
- 6. Spark Structured Streamingを使用してディレクトリを継続的に監視する方法
- 7. Spark Structured Streaming用のTCPソケットを使用してデータを送信する方法
- 8. Spark Structured Streaming Window()関数 - GeneratedIteratorが64 KBを超えて拡大
- 9. Spark Structured StreamingはElasticSearchと統合します
- 10. spark structured streaming(java):タスクがシリアライズできない
- 11. トピック内の複数のパーティションに対するSpark Structured Streaming
- 12. データセット<Row>をSpark Structured Streaming - Java8のkafka出力トピックに書く方法
- 13. Spark Structured Streamingにおけるストリーミングデータフレームとバッチデータフレームの結合
- 14. ClojureでSpark Structured Streamingの例を書き込むときのエラー
- 15. Spark Structured Streamingでの書き込み時のKafkaオフセットのキャプチャ
- 16. Spark Structured StreamingエグゼキュータとKafkaパーティション間のマッピングの説明
- 17. Spark Structured Streamingの日付列のウィンドウ操作
- 18. Spark Streamingでは、バッチ処理が完了したことを検出する方法はありますか?
- 19. Spark Structured StreamingのCassandraのような外部店舗からKafkaとクエリを読み取る方法は?
- 20. Spark Structured Streamingで新しいデータがS3から取得されない
- 21. 状態データが増加している場合、Spark Structured Streamingはインメモリ状態をどのように処理しますか?
- 22. Spark Streamingアプリケーションのデプロイ方法は?
- 23. RDD内のすべてのパーティションを処理した後で、Spark Streamingで入力を受け取る方法は?
- 24. Jackson Streaming APIでカスタムブール型文字列を処理する方法
- 25. RowInemptyを送信するときにSpark Structured StreamingでArrayIndexOutOfBounds例外が発生する
- 26. Spark Streamingアプリケーションの実行中にスキーマの変更を処理する
- 27. Structured Streamingを使用してparquetファイルをHDFSからMS SQL Serverにコピーする方法?
- 28. Spark StreamingをWindowsのスタンドアロンSolrに接続する方法は?
- 29. Spark Streamingマッピング関数で変数をブロードキャストする方法は?
- 30. Spark Structured Streamingを使用してJsonでエンコードされたメッセージを印刷するには
がどのように背圧を定義するのでしょうか? –
つまり、レコードの取り込みレートを動的に管理する機能です。 On Sparkストリーミングを有効にして、Kafkaを使用している場合はkafka.maxRatePerPartitionで作業できます。ストラクチャードストリーミングはどうですか?それは内部的にどのように機能しますか?それはプログラマによって管理可能ですか? –