シャッフルとソートフェーズは、マップタスクの終了前に来るのですか、またはマップタスクから出力が生成された後に来るので、マップタスクに戻ってルックバックはありません。これは私が混乱する「地図のみの仕事」の場合です。 「マップのみ」タスクにシャッフルとソートがない場合、最終出力ファイルにデータがどのように書き込まれているかを誰かが説明することができます。マップ専用タスクにシャッフルとソートがありますか?
答えて
マップオンリータスクを使用している場合、シャッフリングは一切ありません。つまり、マッパーは最終出力を直接HDFSに書き込みます。
一方、マッパとレデューサを使用したMap-Reduceプログラム全体がある場合は、シャッフルは縮小フェーズ開始前に開始できます。 SOでthis very nice answerを引用
:
すべてのシャッフルの第一は、減速に マッパーからデータを転送する処理のことですので、私はそれはそうでなければ、減速のために 必要であることは明らかだと思います、彼らはどんな 入力(またはすべてのマッパーからの入力)を持つことができません。 のマップフェーズが完了する前にシャフリングを開始して、時間を節約できます。そのため、 ステータスがまだ100%でない場合は、 のステータスが0%を超える(ただし33%未満)ことがわかります。
この回答はあなたの混乱を明確にしていました。
おかげさまで、ありがとうございました:)マップフェーズがある場合とは対照的に、マップ専用ジョブの場合、各マッパーの出力はソートされません。後者の場合、マッパーはローカルに出力をソートし、reduceタスクで必要なマップ出力はソートフェーズでマージソートされます。 – vefthym
@vefthymこれは良い点です。つまり、デフォルトでどのように動作するかです。削減フェーズがあるにもかかわらずソート処理を無効にするためにいくつかのフラグを設定することができます。これによりソートが必要な場合のパフォーマンスが向上します。 – dbustosp
@dbustosp与えられた説明をありがとう。私はそのメカニズムをはっきりと理解しています。 – Sidhartha
- 1. HiveのFetchタスクがマップ専用タスクよりも高速に動作するのはなぜですか?
- 2. Fisher-Yatesのシャッフルに何か問題がありますか?
- 3. MonoTouch.Dialogの各RootElementに専用のUIViewControllerがありますか?
- 4. 読み取り専用テキストフィールドにエラーがあります
- 5. pugの繰り返し中にリストをソートまたはシャッフルしますか?
- 6. Javascriptに本来読み取り専用のオブジェクトがありますか?
- 7. JavaソートとScalaソートのパフォーマンスの比較はありますか?
- 8. デベロッパー専用のMacまたはWindowsディストリビューションはありますか?
- 9. トップレベルドメインのSaaS Webアプリケーションに専用のSMTP/POPプロバイダがありますか
- 10. Android TV専用の修飾子があります
- 11. Typescriptインターフェイスの読み取り専用フィールド(名前が '読み取り専用'ではありません)
- 12. IDE専用のJava Swing GUIアプリケーションビルダーツールはありますか?
- 13. Jquery&Sharepoint専用の書籍はありますか?
- 14. Tomcat専用のJRE縮小バージョンはありますか?
- 15. iPad専用アプリでHealth Kitフレームワークのサポートはありますか?
- 16. Windowsユニコード専用の照合はありますか?
- 17. 拡張ドロップダウンメニュー専用のブートストラップクラスはありますか?
- 18. エンティティコンポーネントのプログラミング専用の言語はありますか?
- 19. データベースとアプリケーションサーバーの間に専用のネットワークチャネルを使用する必要がありますか?
- 20. Workflow Foundationを専門とするフォーラムはありますか?
- 21. エンティティフレームワークコードファースト - 既存のテーブルをマップして読み取り専用にすることはできますか?
- 22. リストのソートにエラーがあり、キャストがありません
- 23. Rakeタスク専用のイニシャライザを実行
- 24. 追加専用イベントストアは、追加専用コードベースになりますか?
- 25. TypeScriptには専用のVMがありますか、それともコンパイルするだけですか?
- 26. エラー「タイプ 'タスクに'サブスクリプションメンバーがありません」がXcodeにあります
- 27. ユーザーの読み取り専用Exchangeタスクの作成
- 28. 管理者専用のアクセス権がありません
- 29. VSCodeに実行タスクが表示されないことがありますか?
- 30. JavaScriptを使用してシャッフルしてソートする
地図専用のタスクでシャッフルしないでください。なぜあなたはそこにいると思いますか? –
@ cricket_007私はそこにあると言っているのではない、あるいはそこにいるとは言いません。私はマップのみのタスクに来る場合、シャッフルとソートの概念を理解するのにはちょっと混乱しています。私は質問にいくつかの情報を追加しました。理解することは明らかです。 – Sidhartha
シャッフルはリデューサーとコンバイナーに起こるので、なぜマップ中に起こりますか? –