が含まれている別のドキュメントを生成するために、あなたがたMapReduceと、すべての文書は、Twitterからのつぶやきで、あなたがしたいDBを持っていると仮定します。含まれる単語のあらゆる国 MapReduce:マップ関数の集計?
- 数それらのつぶやきには、その単語のヒット数を数えるカウンタがあります。これは、すべての国のためにも。
私の質問:map関数の単語を集計してカウントしてから、もう一度reduce関数を実行しても問題ありませんか?このようにすると、マップ関数の出力は単一のツイートの情報を表し、reduce関数は同じ国の複数のツイートの情報を集約しますが、これが良い練習であるかどうかは分かりませんMapReduceアルゴリズム...
ありがとうございます!