私は、ログ処理にPIG latinを使用しています。なぜなら、データがハープクラスター全体をセットアップすることを心配するほど十分ではないという問題の表現力です。私はローカルモードでPIGを実行していますが、使用可能なすべてのコア(現時点では16)を使用していないと考えています.CPUを監視すると、最大200%のCPU使用率が示されます。ローカル実行のためのPIGの微調整
ローカル実行用にPIGを微調整するためのチュートリアルや推奨事項はありますか?私はすべてのマッパーがいくつかの簡単な調整で利用可能なすべてのコアを使用できると確信しています。 (私のスクリプトでは、すでにdefault_parallelパラメータを20に設定しています)
お勧めです。