私は「スパークストリーミングの学習」という本を使用してスパークストリーミングを学習しています。本の中で私はDstream、RDD、ブロック/パーティションについて話しているセクションで以下を見つけました。スパークストリーミングの学習
最後に、このスキーマにオーバー練りされた一つの重要な点は、受信インターフェースは、データ片のコレクション(思うアレイ)を提供し、データ・ソースに接続するオプションを有することです。これは、たとえば、一部の逆シリアル化の使用に特に関係します。この場合、レシーバはデータのパーティション分割を処理するためにブロックインターバル待機を行わず、コレクション全体がブロックにデータのセグメンテーションを反映しているとみなし、コレクションの各要素に対して1つのブロックを作成します。この操作は、確実に機能するためにブロック間隔とバッチ間隔の比でブロックを生成する必要があるため、データのプロデューサ側では必要です(すべてのバッチで正しい数のブロックを配信する)。しかし、優れたパフォーマンスを提供することができ、シリアル化のためにすぐに多くのブロックを利用できるようにする実装を提供しているユーザーもいます。
私は頭を叩いていて、著者が何を話しているのか分かりませんが、私は理解しなければならないと感じています。誰かがそれについて私にいくつかの指摘を与えることができますか?
ありがとう、私は今理解しています。しかし、これは何が意味するものであるかを明確にすることができる:「これは、いくつかの逆直列化用途において特に関連がある。 – MaatDeamon