アーカイブの解凍を行わずにjavaのアーカイブから.tsvファイルを取得

-2

私は8つの.tsvファイルを含むアーカイブ_2016_08_17.zipを持っています。私はhit_data.tsvという名前のファイルを抽出し、それをbigqueryにアップロードする必要があります。ファイルはGoogle Cloud Platformのバケットにあります。アーカイブの解凍を行わずにjavaのアーカイブから.tsvファイルを取得

アーカイブを開き、正しいファイルを見つけてその行を画面に印刷する簡単なプログラムを誰かに教えてもらえますか？私はそこからそれを取ることができます。私の考えはgs://path_name/*hit_data.tsvのパスをhit_data.tsvのデータを含むバッファに置き換えることです。

public static void main(String[] args) { 
    Pipeline p = DataflowUtils.createFromArgs(args); 

    p 
      .apply(TextIO.Read.from("gs://path_name/*hit_data.tsv")) 
      \\.apply(Sample.<String>any(10)) 
      .apply(ParDo.named("ExtractRows").of(new ExtractRows('\t', "InformationDateID"))) 
      .apply(BigQueryIO.Write 
        .named("BQWrite") 
        .to(BigQuery.getTableReference("ddm_now_apps", true)) 
        .withSchema(getSchema()) 
        .withWriteDisposition(BigQueryIO.Write.WriteDisposition.WRITE_APPEND) 
        .withCreateDisposition(BigQueryIO.Write.CreateDisposition.CREATE_IF_NEEDED)); 

    p.run(); 
}

出典

2016-08-17 Daniel Lee