が、私は個々のステップにかかる時間よりもそんなに高いデータフロージョブの経過時間の合計である理由を理解することは本当にできないのです個々のステップで撮影した時間の合計よりも、Googleのデータフローで撮影した合計時間があります。
たとえば、画像内のデータフローの合計経過時間は2分39秒です。個々のステップで費やされる時間はわずか10秒です。セットアップに費やした時間とフェーズを破壊する時間を考慮しても、149秒の差があります。これは多すぎます。
個々のステージのタイミングを読むには他の方法がありますか、それとも他に何か不足していますか?
ありがとうございました
ジョブを実行すると、Dataflowは数分(2-5)のワーカーマシンを割り当て、ジョブを実行するためにそれらを設定します。 – Pablo