0
Googleのデータフロージョブを通じてGCSで圧縮ファイルを作成するにはどうすればよいですか?Google Cloud Dataflow TextIO .gzファイルに書き込みますか?
圧縮タイプを指定できません。この機能がまだ存在しない場合は、Google BigQueryのクエリから圧縮ファイルに出力するためのクリーンな方法がありますか?
Googleのデータフロージョブを通じてGCSで圧縮ファイルを作成するにはどうすればよいですか?Google Cloud Dataflow TextIO .gzファイルに書き込みますか?
圧縮タイプを指定できません。この機能がまだ存在しない場合は、Google BigQueryのクエリから圧縮ファイルに出力するためのクリーンな方法がありますか?
TextIOを使用してファイルに書き込むことができます(組み込みのI/O変換の概要は、hereを参照してください)。
あなたがコード hereの例を見ることができます:
PCollection<String> lines = ...;
lines.apply(TextIO.write().to("/path/to/file.txt")
.withSuffix(".txt")
.withWritableByteChannelFactory(FileBasedSink.CompressionType.GZIP));
編集:あなたもGUIから直接、gzip圧縮されたファイルへのBigQueryからテーブルをエクスポートすることができます:
残念ながら、Googleのデータフロー.withWritableByteChannelFactory()を提供していません – Sandeep
正確にどのSDKを使用していますか?上記のコードをbtwに更新しました。 –
com.google.cloud.dataflow:google-cloud-dataflow-java-sdk-all:1.9.0 – Sandeep