0

Googleのデータフロージョブを通じてGCSで圧縮ファイルを作成するにはどうすればよいですか?Google Cloud Dataflow TextIO .gzファイルに書き込みますか?

圧縮タイプを指定できません。この機能がまだ存在しない場合は、Google BigQueryのクエリから圧縮ファイルに出力するためのクリーンな方法がありますか?

答えて

4

TextIOを使用してファイルに書き込むことができます(組み込みのI/O変換の概要は、hereを参照してください)。

あなたがコード hereの例を見ることができます

PCollection<String> lines = ...; 
lines.apply(TextIO.write().to("/path/to/file.txt") 
    .withSuffix(".txt") 
    .withWritableByteChannelFactory(FileBasedSink.CompressionType.GZIP)); 

編集:あなたもGUIから直接、gzip圧縮されたファイルへのBigQueryからテーブルをエクスポートすることができます:enter image description here

+0

残念ながら、Googleのデータフロー.withWritableByteChannelFactory()を提供していません – Sandeep

+0

正確にどのSDKを使用していますか?上記のコードをbtwに更新しました。 –

+0

com.google.cloud.dataflow:google-cloud-dataflow-java-sdk-all:1.9.0 – Sandeep

関連する問題