Hadoopの単語数の例では、map関数で単語と1つを中間結果としてファイルに書き出し、reduceを使用して合計を行います。キーが単語で値がカウントであるマッパー関数でハッシュマップを使用しないでください.1つの単語が1つのファイルの中で複数回出現すると、その単語の値が追加されます。マッパー関数の最後に、結果を書き出します。Hadoopの単語数
このようにして、コンバイナを使用しても、元のデザイン(コンバイナを使用しない)よりも効率的ですが、効率は同等でなければなりません。
アドバイスはありますか?
メモリが原因である可能性があります。 – Robin
メモリ消費量が増えると、最終的にジョブの実行が遅くなります。 – Azim