2
mapreduceを実行すると、マップ出力レコードより大きな入力レコードが結合されていますか?これは本当に奇妙です。私は何が起こっているのか正確に把握できませんでしたか?私が知っている限り、マップの出力レコードは、同じ広告が入力レコードを組み合わせるべきです。誰も私が問題を理解するのを助けてくれませんか?前もって感謝します。マップ出力レコードの数がhadoopの入力レコードを結合するよりも小さい
Map-Reduce Framework
Map input records=112705844
Map output records=64841776
Combine input records=64842079
Combine output records=409
Reduce input records=106
Reduce output records=4