Apache Pig11.1.1をHadoop 2.0.5で実行しています。Apache Pigの接続エラー
私が豚で走るほとんどの簡単な仕事は、完璧にうまく動作します。
しかし、私は大規模なデータセット、またはLIMITのオペレータにGROUP BYを使用しようとするたびに、私はこれらの接続エラーを取得:
2013-07-29 13:24:08,591 [main] INFO org.apache.hadoop.mapred.ClientServiceDelegate - Application state is completed. FinalApplicationStatus=SUCCEEDED. Redirecting to job history server
013-07-29 11:57:29,421 [main] INFO org.apache.hadoop.ipc.Client - Retrying connect to server: 0.0.0.0/0.0.0.0:10020. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
2013-07-29 11:57:30,421 [main] INFO org.apache.hadoop.ipc.Client - Retrying connect to server: 0.0.0.0/0.0.0.0:10020. Already tried 1 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
2013-07-29 11:57:31,422 [main] INFO org.apache.hadoop.ipc.Client - Retrying connect to server: 0.0.0.0/0.0.0.0:10020. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
...
2013-07-29 13:24:18,597 [main] INFO org.apache.hadoop.ipc.Client - Retrying connect to server: 0.0.0.0/0.0.0.0:10020. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1 SECONDS)
2013-07-29 13:24:18,598 [main] ERROR org.apache.hadoop.security.UserGroupInformation - PriviledgedActionException as:gpadmin (auth:SIMPLE) cause:java.io.IOException
奇妙なことは、これらのエラーの後、約2分間の登場に保つということです、彼らは停止し、正しい出力が下部に表示されます。
したがって、Hadoopは正常に動作し、適切な出力を計算しています。問題は、ポップアップを維持するこれらの接続エラーだけです。
LIMIT
オペレータは常にこのエラーを受け取ります。 MapReduceモードとローカルモードの両方で発生します。 GROUP BY
オペレータは小さなデータセットでうまく動作します。
私が気付いたことは、このエラーが表示されるたびにジョブがジョブ中に複数のJARファイルを作成して実行していたことです。しかし、これらのメッセージがポップアップしてから数分後、最終的に正しい出力が表示されます。
これらのメッセージを取り除く方法に関する提案はありますか?
:私は歴史サーバを起動するには、次のコマンドを使用しましたあなたのnamenodeはローカルですか?そうでない場合は、0.0.0.0でアクセスしようとしています。 core-site.xmlからnamenodeの場所を取得していないか、/ etc/hostsファイルが壊れている可能性があります。 –
namenodeはローカルです。 core-site.xmlと/ etc/hostsは、私の他のPig/Hadoopジョブの大半が必要な方法で動作するため、すべて正しく設定されているようです。さらに、接続エラーが数分間表示された後、正しいジョブ出力が表示されます。だから私は問題が他のものだと思う。 –
@AndyBotelho恐らくジョブヒストリーサーバーのログを確認する価値があります –