私は8つの.tsvファイルを含むアーカイブ_2016_08_17.zip
を持っています。私はhit_data.tsv
という名前のファイルを抽出し、それをbigqueryにアップロードする必要があります。ファイルはGoogle Cloud Platformのバケットにあります。アーカイブの解凍を行わずにjavaのアーカイブから.tsvファイルを取得
アーカイブを開き、正しいファイルを見つけてその行を画面に印刷する簡単なプログラムを誰かに教えてもらえますか?私はそこからそれを取ることができます。私の考えはgs://path_name/*hit_data.tsv
のパスをhit_data.tsv
のデータを含むバッファに置き換えることです。
public static void main(String[] args) {
Pipeline p = DataflowUtils.createFromArgs(args);
p
.apply(TextIO.Read.from("gs://path_name/*hit_data.tsv"))
\\.apply(Sample.<String>any(10))
.apply(ParDo.named("ExtractRows").of(new ExtractRows('\t', "InformationDateID")))
.apply(BigQueryIO.Write
.named("BQWrite")
.to(BigQuery.getTableReference("ddm_now_apps", true))
.withSchema(getSchema())
.withWriteDisposition(BigQueryIO.Write.WriteDisposition.WRITE_APPEND)
.withCreateDisposition(BigQueryIO.Write.CreateDisposition.CREATE_IF_NEEDED));
p.run();
}
多分、私は必要以上にハードドライブにアクセスしたくありません。解凍したファイルをハードドライブに保存せずに確実にファイルにアクセスできます。 –
確かに、それはあなたが尋ねたものではありません - あなたの質問を明確にするために更新する必要があります – GreyBeardedGeek
私はそれが最も理にかなった方法でそれを求めようとしました。私はあなたが私の言いたいことを知っていると思います。 –