2
Airflowの多くのオペレータは、ターゲットシステムにアップロードする前にデータをローカルに保存しています。これは、データが巨大な場合に、ワーカーノードが相当量の作業をしていることを意味します。Apache AirFlowはどのようにスケーラビリティを実現しますか?
Airbnb(オープンソースのAirflow社)は、2015年には、気流クラスタ内に6ノードしかなく、5,000のジョブを処理していたと言います。
ここに何か不足していますか?
ご理解ください。