2009-08-31 6 views
0

私たちは4つのデータソースを持っています.2データソースは内部にあり、データベースに直接接続できます.3番目のデータソースにはフラットファイル(.csv)があり、data.4rthデータソース外部にあり、直接アクセスすることはできません。さまざまなデータソースの統合に関する問題

すべての4つのデータソースからデータを取り出し、ビジネスルールを実行してデータベースに格納する必要があります。私たちはこのデータベースの上で実行されるWebアプリケーションを持っています。毎月、データを取り込み、既存のデータに更新/削除/追加などをしなければなりません。

私はこのプロセスについてほとんど無知です。このトピックを勉強するには、いくつかの良い本を指摘してください。

これは私が考えていた現在のアプローチです。

  • は内部datasourecesに話すとミドルウェアを使用して外部データソースにdata.Createハンドラを引っ張ってくる内部Webサービスを記述するためにからデータを.PUll(MQSeriesがいることを再利用することを計画し、すでにいくつかの他の既存のプロジェクトでは、このための設定です) Javaを使用して再度csvファイルを作成します。 このデータでは、Javaからいくつかのビジネスルールを実行します。このデータを使用します。 このアプローチは私の開発者ボックスで実行されるかもしれませんが、すべての問題がprod(特に同期のため)で発生する可能性がありますか?
  • plain java jdbc接続を使用して内部からデータを引き出します。 SQLのloader.Allのデータは、一時的なテーブルfirst.Run businesのルールを介して行くpl/sqlと使用します。
  • (インフォマティカによって呼び出された)perlでdata.writeビジネスルールを引っ張ってインフォマティカのようないくつかのELTツールを使用し

感謝。

答えて

2

Ralph Kimballの "The Data Warehouse ETL Toolkit"のような本は、さまざまな情報源からのデータを1つの場所に集めるためのテクニック/アーキテクチャを学習するための優れたリソースです。

関連する問題