HadoopでI/O(HDFSから読み込む)を実行するときにマップと縮小にかかる時間を測定したいと思います。私は糸を使用しています。 Hadoop 2.6.0。 そのオプションは何ですか?HadoopでHDFSを読み込むときのI/O時間
答えて
大まかに、カスタムカウンタを作成している可能性があります。マッパーとレデューサーの両方で、マッパー(またはレデューサー)が処理を開始し、終了するときにタイムスタンプを収集することができます。開始時刻と終了時刻のタイムスタンプから計算してカスタムカウンターに追加します。つまり、マッパーはMAPPER_RUNNING_TIME
に追加され、レデューサーはREDUCER_RUNNING_TIME
(または名前を付けたい名前)に追加されます。実行が終了したら、カウンターの集計値をそれぞれMILLIS_MAPS
とMILLIS_REDUCES
から引きます。しかし、ステージ時間がMILLIS_MAPS
とMILLIS_REDUCES
に含まれているかどうかを確認するために、Hadoopのソースコードを調べる必要があります。この見積もりでは、タスクが同時に実行されていることを考慮する必要があるため、時間はむしろ合計(またはすべてのマッパーとレデューサーに対して集計)されます。
私はこれを個人的に行っていませんが、あなたがより良いものを見つけない限り、この解決法が機能すると思います。
あなたの提案された解決策は良いと思います。 MILLIS_MAPS =すべてのマップが費やした合計時間(ミリ秒)を発見しました。これにはキュー待ち時間も含まれているのだろうかと思います。このステージングは何を意味しますか? @AlexandruC。 – AlexandruC
残念ながら、私はあなたがソースコードを辿って計算方法を調べる必要があるため、もっと説明することができません。時間がかかることがあります。 – Serhiy
これを行う必要はありません。私はそれをやる。 – AlexandruC
- 1. HadoopでHDFSのファイルに書き込む
- 2. HadoopマップReduce - HDFSファイルを読み込む - FileAlreadyExistsエラー
- 3. 読み取り時間と書き込み時間
- 4. Hadoopのマップで行列を読み込むこと
- 5. AVROデータをHadoopのhdfsに書き込む
- 6. HadoopがHDFSに不完全なファイルを書き込む
- 7. Hadoop with phoenix:phoenixテーブルオブジェクトをhdfsファイルシステムに書き込む方法
- 8. セッションごとの読み込み時間
- 9. HDFSからPhoenixテーブルを読み込むことはできますか?
- 10. ステージステージ1:HDFS読み取り:0 HDFS書き込み:0 FAIL
- 11. データを読み込む問題hdfsからのハイブで
- 12. 読み込み時間
- 13. iframeを含むページの読み込み時間
- 14. Divコンテナと読み込み時間
- 15. クラスJavaでの読み込み時間
- 16. hadoopハイブデータ読み込み
- 17. namenode.LeaseExpiredException非hdfsソースからの読み込み時
- 18. 読み込み/書き込み中のエラー(Hadoop)
- 19. 読み込み時間がgrailsで
- 20. 「見かけの」ページの読み込み時間を短縮する - バックグラウンドでアセットを読み込む方法?
- 21. pysparkデータフレームをHDFSに書き込む方法と、それをデータフレームに読み込む方法は?
- 22. Sparkr HDFSでの読み取り/書き込み
- 23. react.jsで読み込み時間を改善できますか?
- 24. HTML読み込み時間とDOM読み込み時間を決定する方法
- 25. 画面を読み込むためのトラック時間:Angular2
- 26. タイミングクロスドメインのページの読み込み時間
- 27. KafkaトピックをHDFSに読み込む方法は?
- 28. hdfsからバイナリファイルを読み込むには?
- 29. ログページの読み込み時間
- 30. コンポーネントの読み込み時間
私はHTraceを手に入れました。あなたはそれを使いましたか?どのように私が必要とする情報を区切るのだろうか。 – AlexandruC