hadoop mapreduce 2種類

私はHadoop mapreduceを使い慣れました。私はチュートリアルのいくつかを調べて、マッパーの出力がソートされていることに気付きましたが、レデューサー側では、シャッフル&ソートフェーズがあります。hadoop mapreduce 2種類

なぜ2つの種類がありますか？彼らの目的は何ですか？

ありがとうございます！

2016-04-03 milodky

Mapper：ソースからの入力データをキー値のペアに整理して処理します。

リデューサー：集積ロジックがここに書かれています。

Shufflerの役割はシャッフルとソートで、マッパーからレデューサーに出力を渡します。これはMRフレームワークによって内部的に行われます。しかし、MR ApiとJavaを使用して独自のカスタムシャッフルを実装できます。

はWORDCOUNTのこの例を参照して下さい：

2016-04-04 12:06:40 TKHN

お返事ありがとうございます。減速機がキーと値のペアをソートしてより速くグループ化する間に、マッパーの出力をソートするとキーと値のペアが右のレデューサーに放出されるのでしょうか？ – milodky

答えて