Sparkでは、いつでもデータをメモリ内に保持できますが、Hadoop MapReduceのMapステージとReduceステージの間でデータが保持される場所は不思議でした。 HDFS、ディスクまたはRAMに保存されていますか?つまり、データがシャッフルされているとき(マップ/コンバイラの後でReduceの前に)、それはどこに保存されていますか?Hadoop MapReduceのMap/Combine後、Reduceステージ前のデータはどこに保存されますか?
0
A
答えて
2
私はHadoop Mapreduceに関する知識があります。
1)地図タスクの出力は、ローカルディスクに書き込まれますが。()
2)地図/コンバイナの後と前にタスクを削減リデューサータスクの出力は、HDFSに書かれています。
のMapReduceジョブのみマッパータスク出力がHDFS
希望に書かれている場合は、このことができます!!! ...フレームワークはでマップタスクの出力を保存しないのHadoopでは[の
1
通常のHadoop MapReduceでは、各ステップ間のジョブ出力データは、次の手順を開始する前に分散ファイルシステム(HDFS)に格納する必要があります。したがって、減速機はそこからデータを取得しなければならず、これによりディスク/クラスタオーバーヘッド時間が追加されます。
複雑性の高い操作を実行する場合はオーバーヘッドがかなり大きくなります。異なるマップ/ Reduceジョブを順次(Hadoopで)スケジューリングする必要があり、HDFSでデータを保存して取得します。
スパークは、可能であれば、これらの部分的な結果をメモリに保存して大幅に改善します。
1
すべての中間データはHDFSディスクに保存されます。すべてのマップ/リダクション操作は単一ノードで行われないためです。したがって、他のノードでは簡単にデータにアクセス(処理されたデータ)、すべての中間データはHDFSディスクに格納されます。
操作に必要なデータのみがメモリに取り込まれます。
関連する問題
- 1. 名前空間はhadoopにどこに保存されますか?
- 2. Hadoop MapReduceが実行されていません0%Map and Reduce
- 3. Jcommentsのデータはどこに保存されていますか?
- 4. ServiceWorkerのデータはどこに保存されていますか?
- 5. ByteArrayのデータはどこに保存されていますか?
- 6. BigQueryのデータはどこに保存されていますか?
- 7. KeyChainデータはどこに保存されていますか?
- 8. HttpSessionデータはどこに保存されていますか?
- 9. Hiveデータはどこに保存されますか?
- 10. Hadoop MapReduceまたはSparkでデータ前処理を実行するにはどうすればよいですか?
- 11. HadoopカウンタのデータをHDFSに保存することはできますか?
- 12. のHadoopのMapReduceは、今私はのHadoopのMapReduceジョブを実行
- 13. データはどのようにデータベースに保存されますか?
- 14. 私のsqliteデータはiOSシミュレータにどこに保存されていますか?
- 15. Ionic SqlStorageの使用時にsqliteデータはどこに保存されますか?
- 16. Android:大きなアプリのデータはどこに保存されていますか?
- 17. クロムエクステンションの 'chrome.storage.local'データはどこに保存されていますか?
- 18. Windowsのコマンドプロンプトのプロパティはどこに保存されますか
- 19. hadoop reduce tasksでマップされたデータをマップする方法
- 20. エレクトーンは以前のズームをどこに保存しますか?
- 21. Hadoop MapReduce
- 22. 私のアプリケーションのデータはどこに保存しますか?
- 23. ロケールのリソースはどこに保存されていますか?
- 24. 私のプロジェクトファイルはどこに保存されますか
- 25. アンドロイドアプリの画像はどこに保存されますか?
- 26. ウィジェットの設定はどこに保存されますか?
- 27. ネイティブアンドロイドブラウザのクッキーはどこに保存されていますか?
- 28. gdbのブレークポイントはどこに保存されていますか?
- 29. svnのデフォルトコミットメッセージはどこに保存されていますか?
- 30. Magentoのパスワードはどこに保存されていますか?
が重複する可能性を通常のMap-Reduceアプリケーションですか?](http://stackoverflow.com/questions/8603435/in-hadoop-where-does-the-framework-save-the-output-of-the-map-task-in-a -normal-m) – MetallicPriest