2016-05-20 2 views
2

私は400 MBのデータを扱っていますが、スクリプトには5つのセクションがあり、5つのストアコマンドがあります。豚のスクリプトはすごくうまくいく。 しかし、5つのストアコマンドがすべてオンになっていると、ジョブブラウザ(色相)が特定の段階に固執せず、そのまま進行していないジョブを再試行し続けます。 エラーはなく、ログにはエラーも警告もありません。豚のプログラムが何の理由もなくステージに詰まってしまう

私が気づいている問題は、スクリプトが-M属性でうまくいきましたが、もう一度失敗したため、環境問題が原因である可能性があります。

答えて

0

各STOREデータが以前のSTOREに依存する場合は、各STOREの後にexecコマンドを使用できます。これにより、STOREコマンドは、次のコマンドセット/ STOREの前に完全に実行されます。

A = ... 
STORE A; 
exec; 
B = FOREACH A GENERATE ... 
0

エラーは糸によるリソース割り当てポリシーの使用によるものです。 ディスクがいっぱいになると、ノードが不健全になり、メモリが減少します。 現在、ヤーンスケジューラ(フェアスケジューラ)は、利用可能なすべてのジョブに使用可能なメモリの総量を均等に割り当てるだけで、私の場合に発生するデッドロックのチェックはありません。 解決策は、能力スケジューリングを使用して、糸によるスケジューリングを変更することです。

関連する問題