データフローのパイプラインを構築する際に、一見単純な問題があります。私は外部ソースからデータをフェッチし、データを変換していくつかのBigQueryテーブルに書き込む複数のパイプラインを持っています。このプロセスが完了したら、ちょうど生成されたテーブルをクエリするクエリを実行したいと思います。理想的には、私はこれが同じ仕事で起こることを望みます。1つのデータフロージョブでBigQueryを書き込んだり読み込んだりする
これはデータフローの使用方法ですか、BigQueryへの読み込みとテーブルのクエリはジョブ間で分割する必要がありますか?
同じ仕事でこれが可能ならば、BigQuerySinkはPCollectionを生成しないので、どのようにこれを解決できますか?これが同じジョブでは不可能な場合は、別のジョブ(つまり、書き込みジョブと照会ジョブ)の完了時にジョブをトリガーする方法はありますか?
ありがとうございます! BiQuerySinkのインプリメンテーションを作成することは、2番目の答えが私の特定のケースに本当に適合しないため、私がやることです。 – selectle
こんにちは@Supahsmooth、答えがあなたの問題を解決するのに役立つなら、それを投票することも検討してください:https://stackoverflow.com/help/why-vote。それはあなたを助ける人のために非常に便利です:) –