0
私は自分のプロジェクトでSparkを学習していますが、Sparkのシャッフルプロセスに悩まされています。私はこの操作がどのように内部的に働くかを知りたい。 ShuffleMapStage、ShuffleMapTask、ShuffledRDD、シャッフル書く、シャッフル読む....スパークシャッフル操作の仕組みは?
私の質問は次のとおりです:
1) Why we need ShuffleMapStage? When this stage is created and how it works?
2) When ShuffledRDD's compute method is called?
3) What are Shuffle Read and Shuffle Write?