私はmongodbに大きなコレクション(約270万のドキュメント)があり、重複がたくさんあります。私はensureIndex({id:1}, {unique:true, dropDups:true})
をコレクション上で実行しようとしました。モンゴはそれを決定する前にしばらくそれを捨てて、too many dups on index build with dropDups=true
と決めます。MongoDbで重複を削除するにはどうしたらいいですか?
インデックスを追加して重複を取り除くにはどうすればよいですか?または、逆に、mongoがインデックスを正常に構築できるようにいくつかのdupを削除するにはどうすればよいでしょうか?
ボーナスポイントの場合、ドロップできるダップの数に制限があるのはなぜですか?
オプションとして: 'id'ごとに発生数を数えるmap/reduceを実行します。次に、この結果セットを歩き、重複を持つ各 'id'に対して最初のレコードを削除します。 –