2017-04-01 16 views
7

私はYARN上で実行されているスパークジョブを持っていて、ちょうどハングアップしていて計算を行っていないようです。私はyarn application -listをチェックするとき、それはそれはRUNNINGだという、火花の仕事が進んでいるかどうかはどうすればわかりますか?

Application Report : 
Application-Id : applicationID 
Application-Name : test app 
Application-Type : SPARK 
User : ec2-user 
Queue : default 
Start-Time : 1491005660004 
Finish-Time : 0 
Progress : 10% 
State : RUNNING 
Final-State : UNDEFINED 
Tracking-URL : http://<ip>:4040 
RPC Port : 0 
AM Host : <host ip> 
Aggregate Resource Allocation : 36343926 MB-seconds, 9818 vcore-seconds 
Log Aggregation Status : NOT_START 
Diagnostics : 

そして:ここ

は私がyarn application -status <APPLICATIOM ID>を行う際に糸が言っていることです。しかし、私はそれを信頼するかどうかはわかりません。私はスパークのWebUIに行くとき、私はそれを実行してきた唯一のステージ全体の数時間を参照してください。

web UIまた

が、私は「ステージ」タブをクリックしたときに、私は何も実行を参照してください。私のアプリケーションが実際に実行してYARNは私に嘘をついていないことをされていることを確認するにはどうすればよい

Stages tab

私は実際には、エラーが発生するのを待つのではなく、ジョブが実行中であるかどうかを確認します。それ、どうやったら出来るの?スパークアプリケーションのUI

答えて

3

あなたは、リンクをクリックした場合:それはあなたが実行している段階のための詳細を示すだろう「Nativexxxxで寄木細工」。

この画面には、「入力サイズ/レコード」という列があります。仕事が進んでいる場合は、その列に表示されている番号が変わります。

Image shows what I am trying to say

それは基本的にあなたのexecutorが読み込まれたレコードの数を示しています。

+0

Hm。私はそれを見ない。それは進行していないという意味ですか? – Candic3

+0

私たちはちょっとチャットすることができますか? – Candic3

+1

http://chat.stackoverflow.com/rooms/139996/spark-job-progress – Candic3

1

SparkのUIにアクセスして「エグゼキュータ」タブを検索すると、そこにあなたの仕事が実行されているエグゼキュータIDと住所の隣に "ログ"列があります。 "stdout" & "stderr"タブがあります。 stdoutをクリックすると、ジョブが実行されているときにコンテナに書き込まれたログが表示されます。

+0

しかし、ログが書き込まれているからといって、それは必然的にジョブが進行中であることを意味するのでしょうか?ログには、「十分なリソースを待っている」か何かが書かれている可能性があります。 – Candic3

+0

@ Candic3はい、あなたは正しいです。しかし、それはあなたのログを追跡する最良の方法であり、YARNとそのリソースに関連するすべての情報も見ることができます。 – BadBoy777

+0

@ Candic3はあなたの糸クラスターに十分な資源がないようです。 – Kaushal

1

YARNは、アプリケーションが終了していないか、または終了していないため、実行中であると言っています。 止まっているかどうかはわかりません。あなたの場合、糸クライアントモードでSparkジョブを実行し、本当に実行されている場合に示唆すべきログを参照してください。

関連する問題