既存のプロセス - 生の構造データがRedshiftのステージングレイヤーにコピーされます。その後、Informatica、TelendなどのETLツールを使用して、Datamart/datawarehouseのFactおよびDimensionテーブルにインクリメンタルロードを行います。すべての結合はデータベースレイヤー内で行われます(ETLはクエリをDBにプッシュします) - SparkはETLツールを置き換え、同じ処理を行い、Redshiftにデータをロードできますか? - このアーキテクチャのメリットとデメリットは何ですか?EARツールを交換することができます
4
A
答えて
0
InformaticaをSparkに置き換える理由がわかりました。 Informatica BDM 10.1エディションにはSpark実行エンジンが付属しています。これは、InformaticaのマッピングをSparkに相当するもの(Scalaコード)に変換し、クラスタ上で実行します。 また、私の意見では、スパークはETLの場合と同様に、データが変換から変換に変わる中間データではなく、より適しています。
+0
a)Informaticaは高価です。 b)膨大な量のデータ(大きなデータ)を使用すると、ストレージから処理サーバー(Informatica)へのデータ移動が高価になる(処理時間に関して) 3)Informaticaは、上記のデータ処理上の問題を解決するために、 。 UIと急速な開発環境のためだけにinformaticaを支払うことができます(Apache ni-fiを検討してください)。 4)SparkはETLだけでなく、機械学習、リアルタイムストリーミングなどのユースケースを持っている場合に便利です。 Informaticaの代わりにSparkを使用する際の欠点を知りたいと思います。 – Dipankar
関連する問題
- 1. DTS交換ツール
- 2. ドル記号のすべてを交換することができません
- 3. {0}は交換できますが{{0}}は交換できませんか?
- 4. UDP経由でQVectorを交換することはできますか?
- 5. フラグメントを交換すると、アプリケーションがクラッシュすることがあります
- 6. np.arrayの2つの列を交換するとき、ここで何が起こっていますか?
- 7. Node.jsアプリケーションをJava EARとしてパッケージ化することはできます
- 8. コード内の方程式を交換するツール
- 9. oracle apexの< >の交換を防ぐことができません
- 10. ボタンのアイコンを交換するのにcss3またはcssを使うことができます
- 11. は、C#での列挙型は、ルックアップテーブルの交換を使用することができますことができます(例えば、SportType MatchTypeは)
- 12. シンボルを交換することは可能ですか?Actionscript 3
- 13. シェルフセットのトランクを交換することは賢明ですか?
- 14. 交換用のControlTemplateを交換する
- 15. 私たちは、自宅のアプリケーションとすぐに交換することができます
- 16. マッチが起こるが、交換は
- 17. どのように私は古いUIViewControllerを使用してストーリーボードを交換することができます
- 18. キャンドルルートの擬似と春の豆を交換することができません
- 19. std :: G ++で奇妙なことを交換する
- 20. フレックスデータグリッドの列と行を交換できますか?
- 21. mysqli_real_escape_stringと\ nlをどうやって交換できますか?
- 22. sun.reflect.annotation.TypeNotPresentExceptionProxyエラーWeb-earをデプロイするとき
- 23. ビジュアルスタジオでキーが交換されます
- 24. xsd.exeツールでタイプ名を制御することができますか?
- 25. 手術は.earのクラスファイルを置き換えます
- 26. system.jsでrequire.jsを置き換えることができます
- 27. Swiftアプリとバックエンドの間でオブジェクトを交換することはできますか?
- 28. タイトルアイコンフラスコを交換できません
- 29. スウィフト3でカメラを交換するときに記録エラーが発生する
- 30. Linqpadで使用される反射ツールを置き換えることはできますか?
Spark Summitからこのビデオを見るhttps://www.youtube.com/watch?v=vZhSbs1xLx4 :) –
Redshiftのデータ統合についての私の理解は、それがELT - 抽出、ロード、変換であるということです。このためには、SQL文を実行および管理するためのスケジューリング・ツールだけのETLツールは必要ありません。私は、Apacheが発したことを知りません。私にとっては、唯一の欠点は次のとおりです。1.あなたは素晴らしいマッピングをすべて見るためのGUIを持っていません。 2.外部関数(zip、FTPing、Webサービス呼び出し)を実行することは、データベース内で行うのが難しいことがよくあります。 –