私はちょうど答えを見つけることができないという問題があります。私はMySQLで動くPHPのような非常に小さなCRMアプリケーションを開発しました。このアプリケーションのユーザーは、アップロードされたCSVファイルを使用して新しいデータをデータベースにインポートできます。現在解決しようとしている課題の1つは重複していることです。私は以下の持っている場合たとえば、:MySQL同様の行を削除/結合
Record A: [1, Bob, Jones, Atlanta, GA, 30327, (404) 555-1234]
と
Record B: [2, Bobby, Jones, Atlanta, GA, 30327, Bob's Shoe Store, (404) 555-1234]
私は、これらは両方とも類似していることを確認する方法が必要と、(この場合はレコードBに)より多くの情報を持つレコードを取得し、レコードを削除します。
しかし、ここではさらに複雑になります。これは、新しいデータのインポート時に実行する必要がありますし、いつでもデータベースから重複を削除するために実行できる関数です。私はMySQLテーブルからすべての重複行を取得し、電話番号でそれらを一致させる何かを一緒にPHPに入れることができました、または行のすべての列にimplode()を使用し、strlen() 。 これを行うにはより良い方法が必要であり、より正確な方法があるはずです。
あなたが実装したりビルドしたりできる賢明な提案はありますか?新しいデータをインポートするときは、CSVファイルを配列または一時的なMySQLテーブルに開く必要があります。重複/類似検索を行い、CSVファイルを再コンパイルするか、一時テーブルからメインテーブルにすべてを追加してください。おもう。 :)
あなたの誰かが私が紛失しているかもしれない何かを指摘できると思っています。私はむしろ、5,000レコードではなく、5レコードの長さのユーザーに「不確実」な重複のリストを提示したいと考えています。
ありがとうございます! アレックス