1
1つまたは2つの列を除いてほとんど同じ行を含む大量のExcelファイルがあります。 アイデアを伝えるためにサンプルを添付しました。重複したMS Excelを統合して削除する
ここでは例です:
firstname----lastname----phone---address----email
adam--------smith---------123 F st --- [email protected]
adam--------smith-----0256859----123 F st---- [email protected]
adam--------smith---------123 F st---- [email protected]
ので、私は何を取得したいと思いが、この
adam----smith---0.123456, 0256859----123 F [email protected], [email protected]
適切なソフトウェアをインストールして、SQLデータ品質サービスまたはKNIMEなどのジョブを実行します。手動でやりたいのであれば、あなたはそれをやりたいと思う程度に応じて、やや面白いプログラミングをしなければならないでしょう:(1)名前と姓が一致する場合にのみ列を比較したいですか? (2)同じ名字の2人の人はどうですか?それらを差別化する方法は? (3)あなたは名前の類似点を許していますか?たとえば「123F」の「ピーター・スミス」と123Fの「ピート・スミス」などです。彼らは(住所のために)同じであり、名前の類似点ですか?ビルとウィリアムはどうですか? – Ralph