spark.streaming.blockInterval
のブロックとSpark StreamingのRDDパーティションのブロックの違いは何ですか? 2.2.0ドキュメントストリーミングスパークを引用spark.streaming.blockIntervalはRDDパーティションにどのように関係していますか?
:ほとんどの受信機について
は、受信したデータはスパークのメモリ内格納する前にデータのブロックに一緒に合体されます。各バッチ内のブロック数によって、受信したデータをマップ形式の変換で処理するために使用されるタスクの数が決まります。
ブロックの数はブロック間隔に従って決定されます。また、rddパーティションの数を定義することもできます。私が思うに、彼らは同じではありません。彼らの違いは何ですか?