map-reduceジョブのループを実装する必要があります。各反復は、前の反復に応じて終了または続行されます。選択肢は、「1つの単語がレジューサー出力に表示されているか」に基づいています。還元剤がHadoopマップ還元剤のドライバーにメッセージを渡すことはできますか?
もちろん、ドライバプログラムで出力txtファイル全体を調べることができます。しかし、それは単なる一言であり、ファイル全体を見渡すことは過度のことです。減速機と運転手の間にコミュニケーションを構築する方法があると考えていますが、減速機は運転手にそれを検出したら通知することができますか?転送されるメッセージは少ないためです。
Mapreduceは「カウンタ」の概念をサポートしています。あるいは、ループではなくワークフローに組み込んでいるこの「DAGのタスク」を得るために、代わりにSparkを試してみてください –