2017-11-14 21 views
-2

私はこれら2つのサービスについて混乱しています。彼らは同じサービスを提供しているようだ。たぶん唯一の違いは、グルーカタログには広範囲のデータソースが含まれる可能性があるということです。それは、AWS GlueがRedshiftを置き換えることができるという意味ですか?Amazon Redshiftと新しいAWS Glueデータウェアハウジングサービスの違いは何ですか?

+4

AWS Glueはデータウェアハウスではありません。接着剤はETLサービスです。何かあれば、RedshiftとAthenaを比較したいかもしれませんが、Glueはまったく同様のサービスではありません。 –

+0

お返事ありがとうございます。私は間違って私の質問を策定したと思う。 Yes、GlueはETLサービスですが、Redshiftはデータウェアハウスサービスですが、RedshiftはETL機能を備えている必要があります。そうでなければ、ETL操作の適切なレイヤーなしにデータをどのように倉庫に保存できますか?さらに、ストレージとしてのデータウェアハウスは、キーが少なく、正規化の制約がないデータベースに過ぎません。データ・ウェアハウスの重要な要素は、最初はETLプロセスと大規模な保管場所です。 – mksoi

+1

RedshiftにETL機能があり、どのデータベースにもETL層があるとするあなたの前提は間違っています。 Redshiftは分析データベースです。データをETLしてRedshiftにする必要がある場合は、Glueのような別のサービスを使用します。 AWSサービスは、すべてを提供するために単一のサービスを探すのではなく、必要なソリューションを作成するためにまとめたビルディングブロックと考える必要があります。 –

答えて

2

コメントは正しく、これらの2つのサービスは同じではありませんAWS Redshiftはデータウェアハウスサービスで、AWS GlueはETLサービスです。 AWS Documentationによると

アマゾン赤方偏移は、それが簡単かつ費用対効果の高い効率的な既存のビジネス・インテリジェンス・ツールを使用して、すべてのデータを分析することができ、高速、完全に管理され、ペタバイト規模データウェアハウスのサービスです。洗練されたクエリ最適化、高性能ローカルディスク上のカラムストレージ、大規模並列クエリの実行を使用して、ペタバイトの構造化データに対して複雑な分析クエリを実行できます。 AWS Documentationによると

AWS接着剤は、あなたのデータを分類し、それをきれいに、それを豊かにすることは簡単で費用効果的にすること完全に管理ETL(抽出、変換、ロード)サービスで、さまざまなデータストア間で確実に移動

AWSが提供するドキュメンテーションを詳細に参照できますが、本質的に全く異なるサービスです。

+0

お返事ありがとうございます。私は間違って私の質問を策定したと思う。Yes、GlueはETLサービスですが、Redshiftはデータウェアハウスサービスですが、RedshiftはETL機能を備えている必要があります。そうでなければ、ETL操作の適切なレイヤーなしにデータをどのように倉庫に保存できますか?さらに、ストレージとしてのデータウェアハウスは、キーが少なく、正規化の制約がないデータベースに過ぎません。データ・ウェアハウスの重要な要素は、最初はETLプロセスと大規模な保管場所です。 – mksoi

+0

私たちが記憶部分を無視すれば、私はRedshiftでGlueのものと比較して行うことができるETLの操作の違いは何ですか? – mksoi

+0

データベースはETL機能を提供する必要はありませんが、データを取得する方法が必要です。これらは、挿入、更新、削除と同じくらい最小限に抑えることができます。 ETLツールは、データの移動、組織、それらの操作の順序付けおよび同期化、およびデータを移動および変換する操作の開発に特化したツールです。 – Rich

-1

ETL操作を実行し、Redshiftに読み込むために、マリオンETLツールを使用します。このマリオンはS3から読み取ることができます。グルーはブックカタログであり、テーブルはクローラーによって作成され、グルーカタログに追加されます。今はこれがETL操作を行う場所であり、我々はこれらのテーブルをクエリしてレポートを作成するためにatenaを使用します。

関連する問題