2017-07-05 9 views
0

以前のバージョンでは、という構成があり、spark.shuffle.manageと呼ばれ、Sparkのシャッフルアルゴリズムのタイプを決定するために使用されます。 Spark 2.0以降、この設定は削除されます。デフォルトのシャッフルアルゴリズムはソートベースです。私の理解では、タングステンシャッフルは、すべての要件が満たされている場合にのみ有効になります。現在のジョブが元のソートベースシャッフルまたはタングステンソートを使用しているかどうかをどのように知ることができますか?Spark 2.1でタングステンソートシャッフルを有効にする方法は?

ありがとうございました。 SortShuffleManager — The Default (And Only) Sort-Based Shuffle Systemを引用

答えて

1

SortShuffleManagerは短い名前sortまたはtungsten-sortとスパークで唯一ShuffleManagerです。言い換えれば

、(あなたがspark.shuffle.managerプロパティを使用して1を有効にしない限り)あなたが他のShuffleManagerが、SortShuffleManagerを使用することができます方法はありません。

+1

うわー、あなたはマスタリングスパークの著者です!メモは私を助けます!私はあなたが私に返信できるように退場しています。毎回ありがとうございます。だから、現在シャッフルマネージャーは1つだけです。私は[この記事を読む](https://0x0fff.com/spark-architecture-shuffle/)。 3つのアルゴリズム、ハッシュ、ソート、タングステンを導入しています。ハッシュはすでに削除されています。ソートまたはタングステンソートの場合、どのシャッフルアルゴリズムが現在適用されているかをどのように知ることができますか?私は少し混乱しています。タングステンには、その記事で述べたようにいくつかの条件があります。これらの条件が満たされない場合、元のソートアルゴリズムが適用されますか? –

+0

物事はそれ以来変更されており、記事は(当時は非常に良いものの)古いものではありません。自分でコードを見てください。 –

+0

@JacekLaskowski、この質問に関して、なぜ、ハックシャッフルマネージャがspark 2.xで削除されたのか不思議です。ありがとう – seiya

関連する問題