私たちは、AWS上のデータ湖ソリューションの作成を研究している - ここで説明されているものと同様にする - https://aws.amazon.com/blogs/big-data/introducing-the-data-lake-solution-on-aws/アマゾン赤方偏移でELT対ETL
我々はS3にすべての「生」のデータを格納することになり、EMRにロードしますか、必要に応じて赤方偏移。
この段階では、Amazon Redshiftにデータを読み込むためにETLまたはELTのどちらを使用するかについての提案を探しています。 ETL/ELTにはTalendを使用します。
変換前にRedshiftのS3から「生の」データを最初にステージするか、S3のデータを変換してRedshiftにロードする必要がありますか?
私は何か提案/アドバイスをいただければ幸いです。
ありがとうございます。