私は、ログファイルを処理し、いくつかの統計を報告するHadoopジョブを持っています。このジョブはファイルハンドルが不足しているため、仕事の途中で死亡しました。私はファイルハンドルの問題を修正し、 "kill"ジョブを再起動できるかどうか疑問に思っています。「中断した」Hadoopジョブを中断した場所から再開することは可能ですか?
3
A
答えて
4
このように、良い方法はありません。ジョブが一旦終了すると、そのジョブを再インスタンス化し、最初の失敗の直前に処理を再開することはできません。これには本当に良い理由があるかもしれませんが、私はこの問題に話す資格はありません。
私自身のケースでは、大量のログファイルを処理して、これらのファイルをインデックスにロードしていました。さらに、これらのファイルの内容に関するレポートを同時に作成していました。索引付け側での失敗に対する耐性を高めるために(副作用はありませんが、これはHadoopとはまったく関係ありません)、代わりに多くの小規模なジョブを作成するように変更しました。これらのジョブのそれぞれは、これらのログファイル。これらのジョブの1つが終了すると、処理されたログファイルの名前が変更され、再度処理されません。各ジョブは、実行前に前のジョブが完了するのを待ちます。
つのジョブが失敗した
-
、後続のジョブのすべてがすぐにその後失敗します。問題が何であっても簡単に修正し、私の仕事を再提出すると、おおよそ、中断したところで処理が行われます。障害発生時にジョブが99%完了した最悪のシナリオでは、その1つのジョブが誤って無駄に再処理されます。
関連する問題
- 1. 失敗したバッチ・バッチ・ジョブを再開し、中断した場所をどのように取り上げることができますか?
- 2. スレッドの中断と再開
- 3. リストビューの中断と再開
- 4. バックグラウンドで中断した後にAVAudioPlayerを再開する方法
- 5. ジョブを中断して再開した後に、Rで書かれた文字が見えなくなる
- 6. 春のバッチ再試行 - 春はそれが中断したところから開始するか、以下
- 7. Visual Studioでは、型を最初に使用したときに中断することは可能ですか?
- 8. プロンプトの途中で中断されたダイアログは、プロンプトステップの最初から再開します
- 9. LINQ to Objectsクエリを「中断する」ことは可能ですか?
- 10. POSIXスレッドの中断と再開
- 11. SLURM中断したジョブにノードを追加する
- 12. コンテキストマネージャから「中断する」ことはできますか?
- 13. Javaでスレッドを中断、再開、中止する
- 14. ArrayListからのスレッドの再開と中断
- 15. 中から中断する毎に
- 16. 中断されたスクリプトを再開する
- 17. NSUrlSessionはデバイスロックの問題を中断し、再開します
- 18. 中断されたQuartzトリガーが再開しない
- 19. Javaスキャナが入力を中断するのを中断しました
- 20. 失敗したタスクが中断された入力ファイルのポイントで、新しいHadoopタスクが再開されることを保証できますか?
- 21. すべてのユーザープロセスを中断/再開できますか?
- 22. 再利用中断または結合後のブーストスレッド(スレッドプールから)
- 23. n分後にJenkins Freestyleジョブを中断して再起動
- 24. PHP DOMドキュメントLoadHTMLFileはかっこで中断されました
- 25. FreeRTOSは別の機能からタスクを中断します
- 26. Java、スレッドを中断(中断)
- 27. サンドボックス:In App Purchaseの失敗または中断をシミュレートすることは可能ですか?
- 28. ワーカースレッドの中断/再開の実装
- 29. WP7では、ライブラリから曲を再生し、MP3オーディオで中断してから再生を再開できますか?私が達成したいものを
- 30. python asyncIOはどのようにタスクを中断し、再開しますか?
あなたは、仕事全体または特定のノードのタスクの開始を話していますか?いくつかのノードが完了している場合は、出力があり、完了しなかったタスクの補完で実行する必要があります。しかし実際には、私はすべてを再実行する方が良いと思う。もし問題が1つあれば、他にもある可能性があり、回収可能なものを見つけるためにたくさんの粉砕物を掘り起こすことはめったに価値がありません。 – Iterator
もしあなたがそれが自動的に起こりたければ、それのために仕事を設計しなければならないようです。それはある場合には価値があるかもしれません。あなたがそれを元に戻すことができ、それがわかるかもしれないなら、ああ、私はすでにその作品を完成しています、そしてそれを飛ばすことができます。 –
私は全体の仕事について考えている、それは約3分の1だったと私はその仕事を失うことを望んでいた。私は未処理のデータを抽出しようとしていることを知っていますが、その時点でそのジョブを再実行する方が簡単かもしれません。何よりも、私は殺された仕事を再開させる機能を見落とさないようにしたいと思っていました。 – Miles