重複するリストをどのように追跡するかを判断しようとしています。重複が見つかったら重複したリストを赤字で保存する
現在、私は例
superduper duplicate 333
superduper duplicate 555
superduper 557
重複すべきではない文字列は、私は333を「superduper複製」することを追跡するしているが、555と同じである私は、両方の333を追跡する必要があり、 2つ以上の重複が見つかることがあります。
各アイテムには、重複が見つかったID番号が記載されています。
ソートされたリストまたはセットを使用すると、idフィールドを文字列とともに簡単に保存できません。 リストを使用している場合、IDフィールドは格納できません。 私はスコアセットを調べていません。
私はマルチスレッドプログラムを使用しているので、挿入の順序に依存することはできません。
この情報をRedisに保存するのに役立つ構造のアイデア。
「ハッシュとして保存した場合、1000のしきい値を超え、それがメジャーCPUを引き起こします」という場合、ハッシュのIDを参照していますか? – Rabea
ハッシュフィールドが1つのハッシュ内にある – Jason
何かが見つからないことがあります。文字列がRedisのキーであり、ハッシュ内の重複IDのインデックスを作成しようとしていますが、到達している1000のしきい値は何ですか?このhttps://groups.google.com/forum/#!topic/redis-db/eArHCH9kHKAによると、制限はあなたのRAMです。 – Rabea