2016-10-10 7 views
0

私のDataprocクラスタ内の私のノードの1つは、スパークジョブを実行中は常にアイドルです。私はクラスターの削除と再作成を試みました。常に1つのアイドル状態のノードがあります。Google Dataprocノードのアイドル

理由は、数秒ごとに出てくるログからこれら三つの線で示されているように見える:

Trying to fulfill reservation for application application_1476080745886_0001 on node: cluster-4-w-0.c.xxxx.internal:39080 
Reserved container application=application_1476080745886_0001 resource=<memory:4608, vCores:1> queue=default: capacity=1.0, absoluteCapacity=1.0, usedResources=<memory:25600, vCores:6>, usedCapacity=0.90909094, absoluteUsedCapacity=0.90909094, numApps=1, numContainers=6 usedCapacity=0.90909094 absoluteUsedCapacity=0.90909094 used=<memory:25600, vCores:6> cluster=<memory:28160, vCores:40> 
Skipping scheduling since node cluster-4-w-0.c.xxxx.internal:39080 is reserved by application appattempt_1476080745886_0001_000001 

ノードクラスタ-4-W-0.c.xxxx.internalはアイドル状態です。なぜ、ノードはappattempt_1476080745886_0001_000001によって予約され、実行者として使用できないのですか?

答えて

3

アプリの試行はあなたのSparkアプリケーションのアプリケーションIDと一致しているので、アプリの試行はSparkのYARN AppMasterと思われます。デフォルトでは、Spark AppMastersはExecutorsと同じフットプリント(ノードの半分)を持っています。したがって、デフォルトでは半分の労働者が消費されるべきです。

一部のメモリ構成を変更しなかった場合、そのノードに少なくとも1つのエグゼキュータがない理由はわかりません。いずれにしても、spark.yarn.am.cores and spark.yarn.am.memoryを減らしてAppMasterを縮小することができます。

SSHingを実行してyarn application -listを実行するか、またはResourceManager's WebUIに移動して、コンテナのパッキングをよりよくデバッグすることができます。

+0

いいえ、私はエグゼキュータのメモリを半分以上のメモリに設定して、2つのエグゼキュータがノードに収まらないようにしました。 –

関連する問題