こんにちは私は奇妙な仕事を思いついたばかりです:Amazon EMR MapReduceの進行状況のロールバック?
私はEMRを使ってjava-MapReduceジョブを実行します。
データは約1Tで、私は1つのマスター+ 8スレーブを使用しました。
すべてのインスタンスはr2.2xlargeです。
最初に、すべてのものは以下のように正常に見える。しかし
INFO mapreduce.Job: map 0% reduce 0%
INFO mapreduce.Job: map 1% reduce 0%
INFO mapreduce.Job: map 2% reduce 0%
INFO mapreduce.Job: map 3% reduce 0%
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 7% reduce 0%
...
、私はちょうど進歩が戻って(1%〜7%のようなから秋)ローリングになっていることに気づきました。
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 7% reduce 0%
INFO mapreduce.Job: map 6% reduce 0%
INFO mapreduce.Job: map 5% reduce 0%
INFO mapreduce.Job: map 4% reduce 0%
INFO mapreduce.Job: map 3% reduce 0%
....
私は3Gデータのようにテストする場合には、そのような状況が現れていない結果が右であり、プロセスがスムーズに行き、そこにあります。
誰もこの状況が起こった理由を教えてもらえますか?
ベスト。
こんにちは@franklinsijo、最後に、このような状況を克服するためにマップをリセットし、メモリを減らしました。 –