エアフローダグを構築するときは、通常、定期的に実行する簡単なスケジュールを指定します。これが最も一般的に使用されると思います。Airflowでキャッチアップジョブの「予定時刻」を取得するにはどうすればよいですか?
dag = DAG('my_dag',
description='this is what it does',
schedule_interval='0 12 * * *',
start_date=datetime(2017, 10, 1),
catchup=False)
実際のプロセスでは「日付」をパラメータとして使用する必要があるため、現在の日付を確認するだけです。
date = datetime.date.today()
# do some date-sensitive stuff
operator = MyOperator(..., params=[date, ...])
私の理解では、catchup=True
を設定するとエアフローstart_date
となりました(またはend_date
)の間のすべてのスケジュール間隔のための私のダグのスケジュールを持っているということです。例えば毎日。
私のdagインスタンスでscheduled_date
を使用するにはどうすればよいですか?
パーフェクトと呼ぶことができます。私の心の中で '実行日 'とは、タスクが実際に実行されているときです。これは常に「今」ですが、これは意味があり、機能します。 –