AWS Datapipeline - s3バケットの無作為に名前を付けられたファイルをRedshiftにインポート

いつでも新しいファイルがs3フォルダに表示され、RedshiftCopyActivityでRedshiftでインポートすることができます。私はs3からRedshiftにデータを移動できるパイプラインセットアップを持っていますが、特に名前が付けられたファイルがあります。ただし、この場合、ファイル名はランダムにすることができます。私たちは、S3フォルダS3を持ってAWS Datapipeline - s3バケットの無作為に名前を付けられたファイルをRedshiftにインポート

セイのようなものを考えています：// toProcess
時間ごとのデータパイプラインジョブをチェックS3で新しいファイルがある場合：
//があるtoProcess場合は、これらは処理され、削除されます（したがって、次の1時間に処理されません）

これを行う方法についてのご意見はありますか？

出典

2016-06-23 sumit

新しいAWS Data Pipelineを作成する場合、定義済みのテンプレートを使用するオプションがあります。あなたが必要とするもののために、Load Data from S3 Into Redshiftテンプレートはあなたのところでほとんどの方法を取得する必要があります。これらのファイルを削除するには、described hereのようなアクティビティを追加する必要があります。

出典

2016-06-29 19:52:16 JustinDoesWork

AWS Datapipeline - s3バケットの無作為に名前を付けられたファイルをRedshiftにインポート

答えて

関連する問題