S3の2つの異なるバケットからRedshiftテーブルにデータをロードしようとしています。各バケットには、名前に日付を持つディレクトリがあり、各ディレクトリには多数のファイルが含まれていますが、マニフェストはありません。AWS Redshift:S3の多くのバケットからデータをロード
例S3構造:
# Bucket 1
s3://bucket1/20170201/part-01
s3://bucket1/20170201/part-02
s3://bucket1/20170202/part-01
s3://bucket1/20170203/part-00
s3://bucket1/20170203/part-01
# Bucket 2
s3://bucket2/20170201/part-00
s3://bucket2/20170202/part-00
s3://bucket2/20170202/part-01
s3://bucket2/20170203/part-00
はのは、20170201と20170202のための両方のバケットからデータをロードする必要があるとしましょう。ソリューションの1つは、バケットと日付のペアごとに4回のCOPYコマンドを実行できます。しかし、私はそれが単一のCOPY呼び出し内で実行できるかどうか不思議です。私はマニフェストファイルがいくつかの異なるファイル(異なるバケットからのものを含む)を指定できることを見てきました。しかし: - 私は、S3上の一時ファイルを作成しないようにしたい
- ではなく、場所をファイルマニフェストに代わり、完全なパス接頭辞を使用するオプションは、そこにある
- と私はそれを文字列として渡すSQLで何とかマニフェストを使用することができます?