Map-Reduceジョブのタイミング結果がわかりません。例えば、私が走っている仕事は、私にジョブトラッカーから次の結果を与えます。 HadoopジョブのCPU時間は何を意味しますか?
がで終了:CPU時間を費やした(ミリ秒)CPU時間を費やした(MS)地図のためのもので150460の152030 302490
エントリ39sec、1mins、それぞれ削減し、合計。しかし、それでは「CPU時間の消費量」はどのように測定され、それが何を意味していますか?これは、ジョブに割り当てられたマッパーとレデューサーのそれぞれに費やされた合計累積時間ですか?シャッフル、ソート、パーティションなどの時間など、フレームワークから他の時間を測定することは可能ですか?もしそうなら、どうですか?
私を悩ます第2の質問。
long start = new Date().getTime();
boolean status = job.waitForCompletion(true);
long end = new Date().getTime();
System.out.println("Job took "+(end-start) + "milliseconds");
この仕事トラッカー出力の最初のエントリはとにかく提供して何をしていないです:私は、ドライバクラスのgetTime()を使用することをお勧めここではいくつかの記事(Link1、Link2)を見たことがありますか?これは必要ですか?私がIO時間を計算したい時、ノード/ 1ステージあたりの計算時間を計算したいとき、特にハープ・ジョブの時間を計測する最良の方法は何ですか?
異なる投稿に異なる質問を付ける必要があります –