1
当社のデータフローの仕事はしてマージ工程の前に失敗して、出力ファイルの名前を変更することができません:、GSフォルダから2つのテキストファイルを読み込み、それらを変換し、BigQueryのデータセットに書き込む前に、それらをマージし
Unable to rename output files from gs://xxx to gs://xxxx
マージを開始する前に、一時ファイルが削除されているように見えますか?
パイプラインコードを共有できますか? –
どのバージョンのDataflow SDKを使用していますか?あなたが書いているGCSバケツには、どんな種類のTTLを持っていますか?より詳細な情報が必要なジョブIDはありますか? –
パイプライン: 'collection1 = load_all_from_tsv(パス1) コレクション2 = load_all_from_tsv(パス2) ((collection1、コレクション2) | 'Flaten' の両方>> beam.Flatten() | '形式の行' >> beam.FlatMap( ourFormattingFunction) | >> beam.io.Write( beam.io.BigQuerySink( 'project.outputdatasetを' 'にBigQueryへの書き込み'、 スキーマ=スキーマ、 create_disposition = beam.io.BigQueryDisposition.CREATE_IF_NEEDED、 write_disposition = beam.io.BigQueryDisposition.WRITE_APPEND )) ) ' –