重複したレコードを識別するためにRedisインスタンスを使用したいと思います。重複した識別のためにRedisを設定する
いずれのレコードも2つの機能で識別できます。最初の機能は文字列のハッシュです。 2番目の機能は、ハッシュの配列です。したがって、新しいレコードは、文字列ハッシュに一致するものがある場合、またはハッシュの配列内の要素が他の要素の別の配列に存在する場合は、重複しているとみなされます。
例:
レコード1: Id: 1, feature 1: ABC, feature 2: [aa,bb,cc]
レコード2: Id 2, feature 1: ABC, feature 2: []
--->
レコード1
レコード3と重複: Id 3, feature 1: DDA, feature 2: [ff,bd,aa]
-->
レコード1と重複(一致aa
に)
どうすればいいですか?このような操作を実行するには、Redisを最も効率的に使用します。
おかげ
おかげで同じことを行います。私はここで複雑さを少し心配しています.2番目のフィーチャ配列に大きな数字がある場合、 'exists'をN回呼び出す必要があります – AhmadAssaf
@AhmadAssafそれについて心配しないでください。 Redis 3.0.3以降、 'exists'は複数のキーの存在をチェックでき、一度呼び出すだけで済みます。古いバージョンを使用している場合、パイプラインを使用してTTLを減らすことができます。また、すべての作業をluaスクリプトにラップすることもできます。 'eval'または' evalsha'を一度呼び出すだけです。 –