0

ETL移行の初心者です。私はTalendと協力しましたが、まだ大規模なETLプロジェクトをあるツールから別のツールに移行する作業に直面していませんでした(IBM Data ManagerからInformatica PowerCenterまたはInformatica Developer)。ETLツールの移行:パラレル実行のベストプラクティス

マイグレーションジョブの一般的なガイドラインを、あるツールから別のツールへ、そしてもちろん私の特定のケースで探しています。私はより明確になります

データベースソースとTargesが同じになり、私が移行しているのは、ETLの一部そのものです。

アプローチは、このブログで示唆したように、並列実行されます:私はレガシーになります代わりに、古いソフトウェアとしてのみETLをすべてDWHを移行する必要がありません私の場合は

Parallel Run

1新しいものは別のベンダーの製品です(両方ともXMLをエクスポートできます)。

私はパラレル実行のための手がかりを探していますが、元のデータベーススキーマでソースとタージズテーブルをコピーするように提案されていますが、私には最良の方法はありませんスキーマには多数のテーブルがあります)。

DWH私はもちろん、OracleにはいくつかのDBSインスタンスがあり、SQL Serverにはテストサーバーとプロダクションインスタンスがあり、ステージング、ストレージ、データマートの各領域もあります。

私はこの関連する質問とその回答から、プロジェクトごとに各スキーマを外出先にコピーすることを考えています。

Staging in ETL: Best Practices

義務づける方針の参照を持っているためですが、私の特定の場合には、インフォマティカのPowerCenterのIBMデータマネージャからの移行

+0

この質問は、SOのQ&A形式には適していません。しかし、ここにいくつかの一般的なアドバイスがあります。ターゲットdbのコピーを作成します。新しいソフトウェアを使用してELTを再構築します。古いものと新しいものの両方を実行します。彼らはまったく同じ結果を生成することを確認してください。次に、もう一度&再度確認します。できるだけ長く並行して実行してください。これは、あいまいな/まれでないエラーの捕捉の確率を高めます。移行は非常に迅速に非常に複雑になる可能性があります。途中で何も変えないでください。アップグレード、修正、新しいアイデアが待つことがあります。移行日にすべてが間違っていたら、古いソリューションにロールバックできることを確認してください。テストをロールバックします。 –

+0

@ destination-data私はSOのQ&Aフォーマットを理解していますが、自分の質問が私ができる限り具体的なものではないことはわかりません(関連するETLソフトウェアを書いて編集します)。私は意見を求めていない、私はそのような複雑な作業のためのベストプラクティス/経験のリストを要求しています(ETLから別のものへのマイグレーション、それは一般的ではありません)。あなたの提案はすべて合理的で、それは私の最初のアプローチでしたが、答えに答えを書き込むことはできませんが、そこにシニアETLエンジニアがいれば、私にはロードマップを与えることができます私が既に念頭に置いているもの) –

+0

私の質問がSOのQ&Aに適していないなら、私はリンクされたものと多くのものが同じものでなければなりません。もう一方でQ&Aに私の質問が合うようにあなたの提案は何ですか?ありがとうございます –

答えて

1

アプローチであり、さまざまな基準や個人の好みに依存します。どちらの方法でも、ソースシステムと宛先システムの一部または全部を複製する必要があります。ある極端な場合、システム全体の2つのインスタンスを使用できます。テストの一部である複雑なアップストリーム・プロセスを持っているか、大量の表とプロセスがあり、システムを複製するための帯域幅とリソースがある場合、この方法が最適な場合があります。

ETLツール自体に複雑なプロセスが発生した場合、またはテーブルを読み込んで正しくロードされていることを確認する必要がある場合は、テーブルのコピーを作成して新しいツールまたは古いツールをテーブルのコピーは行く方法かもしれません。この方法は非常に簡単でセットアップが簡単です。

このフォーラムは、これらのテクニックに関するブログや詳細な技術記事を置き換えるものではありません。

+0

私は第2のアプローチを進めています。私の知る限りでは、プロジェクトは複雑なETLプロセスを伴わない(新しいものとは異なる可能性があるため、Informaticaも同様です)古いシステムのジョブと同じ時間ではなく、同じソースを使用することができます)からソースを抽出することができます。私はこのアプローチを行っています、少なくとも私は別の要求を持っていません。 –

関連する問題