2016-05-26 10 views
1

私は、さまざまな第三者のデータソースと鉱山からのデータをデータストア(DI)に収集するプロジェクトに取り組んでいます。私たちはこれにPentahoを使用しています。データ統合ソフトウェアとESBの違いは何ですか?

これもESB(CamelまたはMule)で行うことができますか? そして、DIが提供していないESBには他にどんな機能がありますか?

私はESBとDIの両方で多くの記事を読んでいますが、誰もこのクエリを解決できませんでした。私は、第三者のデータソース用のミュールデータコネクタについても読んでいます。

答えて

4

DI(データ統合では 'dependency-injection'ではない)またはETLアプローチは、システムAからシステムBへのデータの移動ソリューションに近づくために、長時間実行されるバッチスタイルのジョブになりがちです。システムA、システムB、またはシステムBに影響を与えることなく、通常はエンタープライズ・メッセージング・システム上でデータ・ストリームにサブスクライブすることができます(データ・ブロックまたはデータ項目ごとに単一イベント)既存のコードプロジェクト。これはまた、プロジェクト計画に人間依存の要件がないことを意味します。 System Cが登場しても、システムBチームのリソースがデータストリームにアクセスするために必ずしも必要というわけではありません。

いずれの環境でも適切なユースケースがあります。しかし、私の経験(Big Data/MDMのベストプラクティスは同意する傾向があります)は、元々のデータストリームがある場合、ある時点でデータストリームにアクセスする他のシステムもあります。組織内の既存のコード、システム、または他のチームを変更することなくデータストリームにアクセスする能力が、ユースケースに役立つと思われる場合は、その前向きな立場で設計し、ESBのアプローチに従うことをお勧めします。これにより、新しい関心のある消費者が来て、既存のシステムによって使用されるプロセスを書き直す必要がなくなります。 ESB/Lightweightインテグレーションシステムでは、DI/ETLツールよりも効率的にそのデザインパターンを使用できます。

いくつかのランダムな思考:

  • ESBのサポートというエラー・キューにルーティングにあなたを可能にすることによって、「1つの不正なレコードの問題は、」それで人間の顔をしているし、その後傾向
  • ETL/DIを再発行すること単純なポイントツーポイント統合ユースケースを過ぎると、ETL/DIが複雑になり始めます。
  • IMHO:ESBはデータセット、サービスのバージョン管理をサポートしています。データモデル。
  • ETL/DI
  • データマッピングタスクを実行するために、非技術的なユーザーのために、より成熟したUIのを持っている傾向があるESBのシステムのランタイムデカップリングをサポートするには本当に強いです。システムBが停止している場合、データはバックアップされるまで待ち行列に格納されます。いいえ長いESBはわずかに高いランプアップ曲線
  • ETL/DIは、一般的に
(ほとんどのベンダーは、両方のDIとESB製品を提供します)最終的にはESBにつながりました
  • ジョブを再開することの阻止スレッドまたはリスクを実行しません
  • +0

    Matt、あなたの答えは十分ですが、私はここでもっと答えを見せたいと思います! – user34567

    関連する問題