分散クラスタが「ハングアップ」しているように見えます。タスクは処理を停止し、未処理のタスクのバックログが蓄積されるため、何が起こっているのかをデバッグするのに役立つ方法を探しています。特定のDaskタスクに関する情報を取得する方法
Client
にはClient
オブジェクトで利用可能なタスクに関する唯一の情報であるAFAICSではなく、各ワーカーで現在実行中のタスクを教えてくれるprocessing
メソッドがありますか?
私が望むのは、処理タスクだけでなく、処理され、処理され、エラーが発生し、各タスクについて、submitted_time
とcompletion_time
などの統計情報を取得できるようにすることですどのタスクがクラスタをブロックしているかを知ることができます。
これは、任意のは、あまりにも仕事を与えるためargs/kwargs
を得ることができるようにすることですipyparallel.AsyncResult
あると便利で拡張メタデータと同様です。これは、失敗したタスクのデバッグに特に役立ちます。
この機能は現在利用可能ですか、それとも後で情報を入手する方法がありますか?
問題をデバッグする方法に関するその他の提案は、大歓迎です。
それがあるべきように見える:
def f(keys, dask_scheduler): return dask_scheduler.transition_story(*keys)
–おかげで@DaveHirschfeld。一定 – MRocklin