異なるレデューサーで同じキーで値を処理することは可能ですか?すべてのマッパーから同じキーでデータが得られました。異なるレデューサーで処理したいのですか?私の混乱は...本は同じキーを持つすべての値が同じ減速に行くだろうと言うことです同じ鍵違いのレデューサー(HADOOP)?
mapper1(k1,v1),mapper2(k1,v2),mapper3(k1,v3) and so on...
私はそれのようでなければなりません...同じ減速にすべてのデータを望んでいない、
reducer1(k1,v1),reducer2(k1,v2)....
とはSUM1とreducer2プロデュースSUM2を生成reducer1言うことができますし、私は
sum=sum2+sum1
がどのように私はそれを行う必要があることをしたいですか?
あなたは...コンバイナを使用して、上記行い、その後、減速中コンバイナの出力をまとめる傾ける理由はありますか? – Suchet
それは私は非常に大きなデータを持っていると仮定します(私は行列の行数が膨大で、最終的にはすべての要素の合計が必要です)、これを合算したい場合は、全体として、すべてのコンバイナの出力を1つに減らす必要があります(私は9時です)。非常に遅いプロセスにつながります。 – Divyendra
あなたはHadoopの分散性質の恩恵を受けていません。より多くのマッパーが入力ファイルを同時に処理できるように、データを分割します。これらの問題は簡単です。 – Suchet