Sparkクラスタから非常に奇妙な動作が見られます。スパークロギングがドライバに送信されず、ワーカーにのみメッセージが存在する
INFO 2016-11-04 13:14:10,671 org.apache.spark.executor.Executor: Finished task 227.0 in stage 4.0 (TID 3168). 1992 bytes result sent to driver
これらの多くの場合、かなり速いコンソールを埋めると、アプリケーションがの多くを使用する場合は特に、によって達人:1が1がそうのようなログメッセージを表示されます実行したときにロギング用
通常の動作ですパーティション。
しかし、spark-submitを実行した後、通常のログメッセージが表示されません。おそらく約5行。むしろ、すべての通常のログメッセージはSpark UIのドライバstdoutにあります。
質問はどのような設定で、Sparkにこれらのログエントリをドライバに返さないように指示する可能性がありますか?
ログメッセージが複数の場所に分割されている場合、アプリケーションをデバッグするのは非常に難しいため、むしろ面倒です。通常、私はspark-submitを実行した後、ログが画面に流入するのを見て、それが何をしているのかを感じます。イベントの後にログを見なければならないので、今私はその気持ちを得ることができません。
ログ収集で単一障害点を突き止めるのは危険だと思いませんか? –
@LostInOverflow私は、アプリケーションをデバッグしようとしています。 – samthebest