私は、データの準備のために豚を使用している、と私は簡単なようだが、私は対処できないという問題に直面:どのようにすることができる。例えば豚に行番号を生成するには?
を、私はその後、名前
name
------
Alicia
Ana
Benita
Berta
Bertha
の列を持っています私は各名前の行番号を追加しますか?結果は次のようになります。
name | id
----------------
Alicia | 1
Ana | 2
Benita | 3
Berta | 4
Bertha | 5
この質問をお読みいただきありがとうございます。
はShatlykが、私はどちらも豚ラテン語で道を見つけませんでした、ありがとうございました。はい、実際には並列アルゴリズムではありませんが、削減ノードを1つだけ使用するという考えは問題を解決することができます – Breakinen
減速器はマッパー入力全体と同じサイズのデータを処理する必要があるため、 map-reduceプログラム。私はタスクトラッカーがグローバル変数を維持できないので、このような本当に並行プログラムを実装するのは非常に難しいと思っています^^ BTW、最後に私はただ一つのマシン上でJavaプログラムを使うだけでこの問題を解決しました。それは速いです:) – Breakinen
まあ、私の場合、「列挙部分」は小さなステップでした。シングルリダクションマシンは長い時間がかかりましたが、他のステップが支配していました。 –