私はMapReduceフレームワークについてかなり混乱しています。私はそれについてさまざまな情報源からの読書を混乱させている。ところで、これは私のMapReduceジョブのアイデアですシャッフルフェーズとコンバイナフェーズの違いは何ですか?
1. Map()-->emit <key,value>
2. Partitioner (OPTIONAL) --> divide
intermediate output from mapper and assign them to different
reducers
3. Shuffle phase used to make: <key,listofvalues>
4. Combiner, component used like a minireducer wich perform some
operations on datas and then pass those data to the reducer.
Combiner is on local not HDFS, saving space and time.
5. Reducer, get the data from the combiner, perform further
operation(probably the same as the combiner) then release the
output.
6. We will have n outputs parts, where n is the number
of reducers
これは基本的に正しいですか?私はコンバイナがシャッフルフェーズであることを示すいくつかの情報源を見つけました。基本的に各レコードをキーでグループ化しています。
メッセージ内の数字は、各操作が行われる順序を表していますか? – Amit
はい、私の心の中ではい。 – rollotommasi
クール、とにかく、私は以下の答えは、ポイントを説明すると思います。 – Amit