複数のソースシステムからのデータの統合を含むデータウェアハウスプロジェクトに取り組んでいます。顧客ディメンションに値を設定するSSISパッケージをセットアップし、ゆっくりと変化するディメンションツールを使用して、顧客に対する更新を追跡します。SSISのscdの代替手段を理解するのに役立つ
私はいくつかの問題を抱えています。この例を取る:Aは、そのようなレコードは次のようになります可能性があります
ソースシステム:
名、姓、14222
ソースシステムBはのレコードを持っているかもしれません郵便番号 ジェーン、ドウ、次のようになり、同じクライアント:
名、姓、郵便番号 ジェーン、ドウ、不明
私が最初にシステムAからレコードをインポートする場合、私は最初の名前を持っています、姓、および民族性。すばらしいです。今、システムBからクライアントレコードをインポートすると、ファジィマッチングを実行して、これが同じ人物であることを認識し、緩やかに変化するディメンションツールを使用して情報を更新できます。しかし、この場合は、「不明」が有効なデータを上書きするため、郵便番号を失うことになります。
私は間違った方法でこの問題に近づいているのだろうかと思います。 SCDツールは、新しいデータが有効かどうかに基づいて属性を選択的に更新する方法を提供していないようです。マージステートメントはうまくいくでしょうか?私が見ていない基本的なデザインミスをしていますか?
アドバイスありがとうございます!
内蔵SCDツールの限界を確認いただき、誠にありがとうございます。私は今のデザインを廃止する前に、これが事実だろうと思っていたが、いくつかの外部の確認を求めていた。 –