冗長な不良データを持つデータベースがあります。例として、記事の一部の名前には大文字の小文字の違いがあり、その他にはアクセントの問題、他は不足している文字などがあります。アイデアは、実際に同じdbレコードをマージすることです。データクレンジング:ユーザーが入力したデータベースデータツール
はそこに簡単にクリーンアップデータベース、理想的には、これは自動的に行われないことになるために許可するが
冗長な不良データを持つデータベースがあります。例として、記事の一部の名前には大文字の小文字の違いがあり、その他にはアクセントの問題、他は不足している文字などがあります。アイデアは、実際に同じdbレコードをマージすることです。データクレンジング:ユーザーが入力したデータベースデータツール
はそこに簡単にクリーンアップデータベース、理想的には、これは自動的に行われないことになるために許可するが
は、データクレンジングのためにそこにかなりの数のツールがありますユーザーの確認が必要になることがあり素敵なツールです。また、データクレンジングをサービスとして提供する多くの企業があります。
私はいくつかの大企業のデータクレンジングを行ってきましたが、これは簡単な作業ではないか、またはデータの重複も、エクササイズを開始するまで明らかにならないあらゆる問題を含んでいます。
IMHOでは、レガシーデータが比較的貧しい国で、この(かなり特殊な)分野に社内の専門知識がない場合は、可能性が高いため、これを行うために第三者を採用することにします最初から開始するよりも早く、より低い総コストで実行することができます。
これを行うための社内スキルを構築したい場合は、私はいくつかの簡単なGoogle検索を行い、提供されている多くのソフトウェアパッケージを見てきました。これらのお互いの相対的な強みあなたが浄化しようとしている特定のタイプのデータは、あるものが他のものよりも優れているように見えます。
希望すると、 の写真が表示されます。