2012-03-12 4 views
0

SQL Server 2012 DQSでナレッジベースを構築しようとしています。私がDQSを実行しようとしている生データでは、不幸にも人名と会社名の両方を保持できる完全な名前のフィールドがあります。 DQSを使ってこのフィールドを洗う方法とパースする方法について助言を得ている人がいれば、参照データサービスを購入せずに会社名をFirstNameまたはLastNameドメインに入れるが、名前を指定すると、名前全体が適切なドメインに解析されます。DQSコンポジットドメイン - 生データ名フィールドに人と会社の名前があります

私は、FirstName、MiddleName、LastNameの各ドメインで構成されたFullNameという複合ドメインをセットアップし、それを生データにマッピングしました。その後、複合ドメイン知識ベースの解析を使用してこれらの値をそれぞれのフィールドに解析しようとしましたが、残念ながら会社名を人のように解析して、「& Associates Inc」などのような姓を多く取得します。

これは、ビジネスワードのドメインを作成し、基本的には、FullNameドメイン内の単語のいずれかがBusinessWordドメインにある場合は全体名FirstNameドメインで、最初、中、最後に名前を解析しようとします。このタイプの参照はDQSの機能を超えていますか?

これまでDQSのCDルールで見つかった唯一のものは、ハードコードされたルールを作成することです。すなわち、都市が「ロンドン」であれば国を「イングランド」に変更しますが、 BusinessWord FullNameでは、FirstNameにすべてを置きます。 DQSを試している人が、このような問題を抱えていて、参照データサービスのためにばかげた金額を支払うことなく解決できるかどうかは不思議です。

名前と住所をこの物できれいにすることができない場合、それは何のために良いですか?

ありがとうございます。

答えて

0

私はSSISワークフローの一部としてDQSタスクのKBを使用してこれに取り組んでいます。このblog postには、DQSタスクの使用方法に関するリファレンスがあります。状況に応じて、ステータス列の出力(ルールの定義)を使用して、追加のSSISタスクを介してビジネスルールに従って出力をリダイレクトします。

私はこれが理想的ではないことは知っていますが、手元にある直ちの課題を解決できると思います。

関連する問題