hadoopジョブ・カウンタでは、「マップ出力マテリアライズド・バイト」と「マップ出力バイト」の違いは何ですか?私は地図出力の圧縮を無効にすると前者は表示されないので、実際の出力バイト(圧縮されたもの)は後者が圧縮されていないバイトだと思いますか?「マップ出力マテリアライズド・バイト」と「マップ出力バイト」との比較
6
A
答えて
10
あなたは正しいと思います。 からhttp://hadoop.apache.org/docs/r1.0.4/releasenotes.html:
MAPREDUCE-2365。 FileInputFormat(BYTES_READ)およびFileOutputFormat(BYTES_WRITTEN)の新しいカウンタ。圧縮MapOutputSizeの新しいカウンタMAP_OUTPUT_MATERIALIZED_BYTES。 (シッダールタセス)
(Hadoopの0.20.2からの変更)
.............................. .................................................. ..................................................
:.................ここ
はトム・ホワイトの "HadoopのDefinitive Guideの" からの引用、第3版(表8-2、261ページ)であります"Map output materialized bytes" - 実際にディスクに書き込まれるマップ出力のバイト数。マップの出力圧縮が有効になっている場合、これはカウンタ値に反映されます。
"マップ出力バイト" - ジョブのすべてのマップによって生成された非圧縮出力のバイト数。地図のOutputCollector
でcollect()
メソッドが呼び出されるたびにインクリメントされます。
関連する問題
- 1. 共通キーのマップと出力を比較する方法は?
- 2. HMACSHA256出力バイト/ビット
- 3. アレイとマップ出力乗算
- 4. 文字列出力の出力比較
- 5. 比較XSL出力
- 6. HBaseマップ出力をhdfs&HBASeに出力
- 7. 出力キャッシュとブラウザのキャッシュの比較
- 8. SimpleDateFormatの出力と数値の比較
- 9. estimator.evaluateの理解と比較の出力
- 10. Spark - MapOutputTrackerMasterEndpoint:マップ出力ステータスは、akkaフレームサイズを超えるNバイトでした。
- 11. Guava MultiSetとマップの比較
- 12. マップ上のPython出力websocket
- 13. powershell出力の比較
- 14. ファイルのn番目のバイトと最後のバイトを出力する
- 15. バイト[]配列を出力すると予期せぬ出力が発生する
- 16. バイトと16進数の比較?
- 17. アクセスハープ中間マップ出力ファイル
- 18. 混乱比較出力
- 19. バイト配列とバイト配列リストを比較するには?
- 20. 整数と比較するバイト
- 21. タイプキャスト後に1バイトを出力して
- 22. バイト値mikrotikの比較スクリプト
- 23. バイト配列の比較
- 24. バイトを2進数の文字列として出力する
- 25. シェル内のテストの結果と入力と出力を比較する
- 26. powershellの比較オブジェクト出力の問題
- 27. 文字列とマップの比較
- 28. マップの出力を注文する
- 29. jsonの結果をGoogleマップに出力
- 30. スカラ:クエリ出力の比較を実行
私の仕事の詳細ページで「Map output materialized bytes」が表示されないようです。私はHadoop 2.0.0-mr1-cdh4.2.1を使用しています。私はいくつかの設定を変更する必要がありますか? –