2017-02-12 17 views
0

AWS EMRでスパークアプリケーションを実行しようとしています。私はsparkSQLの全プログラムを書いた。プログラムが完了するまでに時間がかかっていたので、ログ情報をチェックして、エグゼキュータはすでにタスクを実行していましたが、SQLコマンドの解析にはログが見つかりませんでした。 ログ情報の抜粋です。クエリを解析する前に完了したタスク

17/02/12 04:32:56 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1603 on executor id: 20 hostname: ip-10-11-203-20.ec2.internal. 
17/02/12 04:32:56 INFO TaskSetManager: Finished task 179.0 in stage 32.0 (TID 1585) in 42268 ms on ip-10-11-203-20.ec2.internal (182/200) 
17/02/12 04:33:02 INFO TaskSetManager: Starting task 198.0 in stage 32.0 (TID 1604, ip-10-178-43-214.ec2.internal, partition 198, NODE_LOCAL, 5295 bytes) 
17/02/12 04:33:02 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1604 on executor id: 13 hostname: ip-10-178-43-214.ec2.internal. 
17/02/12 04:33:02 INFO TaskSetManager: Finished task 180.0 in stage 32.0 (TID 1588) in 39417 ms on ip-10-178-43-214.ec2.internal (183/200) 
17/02/12 04:33:03 INFO TaskSetManager: Starting task 199.0 in stage 32.0 (TID 1605, ip-10-11-203-20.ec2.internal, partition 199, NODE_LOCAL, 5295 bytes) 
17/02/12 04:33:03 INFO YarnSchedulerBackend$YarnDriverEndpoint: Launching task 1605 on executor id: 18 hostname: ip-10-11-203-20.ec2.internal. 
17/02/12 04:33:03 INFO TaskSetManager: Finished task 183.0 in stage 32.0 (TID 1589) in 38574 ms on ip-10-11-203-20.ec2.internal (184/200) 
17/02/12 04:33:04 INFO TaskSetManager: Finished task 186.0 in stage 32.0 (TID 1592) in 34329 ms on ip-10-11-203-20.ec2.internal (185/200) 
17/02/12 04:33:15 INFO TaskSetManager: Finished task 187.0 in stage 32.0 (TID 1593) in 38905 ms on ip-10-178-43-214.ec2.internal (186/200)  

誰でもここで起こっていることを説明できますか?ありがとう。

+0

「SQLコマンドを解析するログ」は、どのように表示されますか? INFOレベル(DEBUGではなく、印刷されていないようなログ)にこのようなログがありますか? –

答えて

0

実際にSQLを解析するのは非常に高速です。ログの先頭を確認すると、確実にログを解析することができます。

今すぐ見ることができます - スパークはすべての実行ステージをタスクに分割して(並列実行を実現します)、これらのFinished taskログはクエリが進行中であることを通知するだけです。

関連する問題