コーディングは大きな柔軟性を提供します。それはPerl、Python、C#、Java、SQLなどとなります。いくつかのデータ変換をすばやく簡単に構築できます。なぜ誰もETLソフトウェアを見ることさえ気にしませんでしたか?
ソリューション全体を準備しているとしましょう。選択した言語のすべてのスクリプトがそこにあります。いくつか質問があります:
- データ量が増え、すべてをメモリに収めることができない場合、キャッシュはどこに作成されますか?あなたはそれを制御できますか?
- どのようにすべてのログを作成しますか?あなたはそれを作成しましたか?
- エラー処理はどうですか?エラー(ディスクスペースの問題、接続の問題、etsなど)が発生した場合は、その原因を簡単に示していますか?
- どのように監視しますか?ダイナミックダッシュボードはありますか?
- ソリューションでクラスタリングが可能ですか?
- いくつかのデータ変換を複数のスレッドで実行して、より高速に実行できますか?
- フェールオーバー:どのように障害を処理しますか?障害の発生した場所からジョブを再開することは可能ですか?
- 接続性:新しいデータソース(Salesforceなど)が表示され、スクリプトを読み書きするためにどの程度の時間を必要としますか?
- SAPのようなERPシステムに接続できますか?
- スクリプトからデータ系列と影響分析を取得できますか?
降下ETLソフトウェアを使用すると、これらのすべて、さらにはさらに多くが得られます。誰かが懸命に働いていて、何年もの間、そのようなトラブルに対処してGUIを手に入れました。それは違いです。
Now:しばらくの間、1つのファイルをDBにロードする必要がある場合、何かがあります。しかし、あなたがそれらの多くを持つことを計画している場合、ETLソフトウェアは検討する価値があります。 Informaticaがすでに社内にある場合は、なぜホイールを悩ませ、再発明するのでしょうか?
"監視して再実行"だから、いいGUIを持っていると言えますそれは何か価値がある?いくつかのWebツールと一緒にすばやく投げることのできるものではありませんか? –
Ville M:そうですね、素早く「一緒に」投げつけるのが難しい素晴らしいGUIがあります。あなたはすぐに、あなたが時間の90%を使用するカスタム言語でアプリの20%を一緒にスローすることができることです。カスタムソリューションを使用すると、Informaticaで完全にベースとなるものや、まったくできないものを簡単に実行できます。 – runrig