0
同じPIGスクリプトの倍数「インスタンス」を持つワークフローの実行時間を、特定のクラスタ(512GB RAM、100 vCores)に対して最小化しようとしています。PIG:PARALLEL句にどのように良い値を選ぶか?
COGROUP操作のPARALLEL句の値を大きくすると、より良い結果が得られます。しかし、そのような句のために良い価値を拾うための式はありますか? PIGのドキュメントはそれについて非常に避けています!
HDFSブロックサイズは何ですか? – madbitloman
こんにちは、HDFSのブロックサイズは1GBです、ありがとう! – drwho2