フラットファイルからSQL Server 2008テーブルにデータを取り込んでいます。それは私がマッチングを行うために必要なアドレス情報を含んでいるので、データをいくつか整理する必要があります。SQL Server 2008で受信した文字列フィールドを効率的にクリーンアップする方法はありますか?
私は共通の略語/用語と公式の米国郵便局の対応するテーブルを作成し、アドレス文字列を受け入れ、置換とabbreviationsテーブルのデータを使ってきれいにされたアドレス文字列を返す関数を作成しました。
インポート後にテーブル上でUPDATE
を実行し、アドレスフィールドにSET
を実行すると、関数から返された文字列が有効になりますが遅くなります。私はかなり新しいSQLですが、これを行う良い方法はありますか?おそらくSSISのインポート中に挿入される前ですか?
正式な情報源からのデータが入力されたときにそのデータを検証することを検討しましたか?既存のデータについては、インポート前にクリーニング(または "スクラブ")サービスでアドレスリストを実行するだけです。 それ? – Matt