N個のファイルを含むzipがあるとします。 Dataflowを使用して各ファイルを1つずつ処理します。これは可能ですか?圧縮ファイルを1つずつ読み取る
zip内の各ファイルを処理し、その中のデータをBigQueryテーブルにダンプする必要があります。したがって、各ファイルは別々のBigQueryテーブルにダンプされます。
Dataflowを使用してzipファイルを読み込もうとしましたが、一度にすべてを読み込みました。私は、ジッパー内のさまざまなファイルを区別することができなければなりません。
はあなたが
なぜsecuenciallyと並列ではありませんか?それぞれのファイルを個別に圧縮してクラウドストレージに保存してから、ETLを実行することができます –