ハイブの特定のタスクに対して作成されるマッパーとリダクションの数は常に混乱します。 例:ブロックサイズ= 128MBで、365個のファイルが存在する場合、それぞれ1年の日付にマッピングされます(ファイルサイズはそれぞれ1 MBです)。日付列に基づくパーティションがあります。この場合、データのロード中にいくつのマッパーとレデューサーが実行されますか?ハイブでpartitonedテーブルに作成されるマッパーとリダクションの数
0
A
答えて
0
マッパー:マッパーの
番号は、データをノード間で分散する方法、入力形式、実行エンジンや構成のparamsのような様々な要因に依存します。 https://cwiki.apache.org/confluence/display/TEZ/How+initial+task+parallelism+works
MRはCombineInputFormatを使用し、Tezはグループ化された分割を使用します。
TEZ:
set tez.grouping.min-size=16777216; -- 16 MB min split
set tez.grouping.max-size=1073741824; -- 1 GB max split
のMapReduce:手動マッパーの数を制御することは容易ではない理由
set mapreduce.input.fileinputformat.split.minsize=16777216; -- 16 MB
set mapreduce.input.fileinputformat.split.minsize=1073741824; -- 1 GB
はまたマッパーは、データが配置されているデータノードで実行されている、すなわち、常に入力を結合することはできません。
レデューサー: レデューサーの数を制御する方がずっと簡単です。 還元剤の数は、
mapred.reduce.tasks
に従って決定されます - ジョブあたりの削減タスクのデフォルト数。通常、使用可能なホストの数に近いプライムに設定されます。 mapred.job.trackerが "local"のときは無視されます。 Hadoopはこれをデフォルトで1に設定し、Hiveはデフォルト値として-1を使用します。このプロパティを-1に設定すると、Hiveは自動的に減速機の数を決定します。
- Hive 0.14.0以前のデフォルトは1 GBです。
hive.exec.reducers.max
- 使用するレデューサーの最大数。 mapred.reduce.tasks
が負の場合、Hiveは自動的に減速器の数を決定する際にこれを最大減速器の数として使用します。
だから、あなたは、減速機の並列性を高めるhive.exec.reducers.max
を増減したい場合は
関連する問題
- 1. テーブルごとにDbテーブル、モデル、マッパーを作成する
- 2. jsonデータのハイブ作成テーブル
- 3. Pythonでマッパー関数を作成する
- 4. ハイブ - XML- Serde - キー値ペア - テーブルの作成
- 5. ネストされたリストとのシフト/リダクション
- 6. ハイブはネストされたavroスキーマのテーブルを作成できません
- 7. ハイブプロトコルバッファ - ハイブでテーブルを作成中にNullPointerExceptionが発生する
- 8. ハイブでテーブルの空のコピーを作成する方法
- 9. ハイブでバケットファイルを作成するとき
- 10. テーブル作成時のSpark Vectorに相当するハイブ
- 11. ハイブ - 新しいテーブルを作成し、更新されたデータを挿入する
- 12. hdfsからcsvファイルを使用してハイブでテーブルを作成すると、ハイブで別のデータコピー
- 13. sqoopインポート中にハイブにテーブルを作成することに関連するクエリ
- 14. ハイブ:複数のファイルを複数のディレクトリに作成する
- 15. ハイブは、新しいテーブルを作成するには
- 16. リフト・テーブルを使用してハイブ・テーブルを作成
- 17. ハイブはhiveserver2でテーブルを作成できません
- 18. ハイブでテーブルを作成できません
- 19. ハイブでビューテーブルを作成
- 20. のC# - マッパーと構成ファイル
- 21. 作成したオブジェクトインスタンスをマッパーに渡す
- 22. ハイブはテーブルを作成できません
- 23. ハイブからhbaseテーブルを作成できません
- 24. ddlファイルからハイブにテーブルを作成します
- 25. ハイブ:プロジェクトフォルダにmetastore_dbが作成されるのはなぜですか?
- 26. ハイブ外部テーブルからデータフレームを作成する方法
- 27. ビューを作成するとテーブルが作成されます
- 28. Sqoop作成・ハイブ・テーブルSQL Serverのデフォルト以外のスキーマ
- 29. ハイブ - 問題のあるテーブルを作成する列にスペースがある
- 30. サイドビューの結果からハイブ外部テーブルを作成