私は定期的にウェブページのリストにコメントを刻んでデータベースに挿入するPythonスクリプトを持っています。しかし、それはまだそれがデータベースにないコメントだけを挿入します。次回は、それが既に挿入されているかどうかを確認する必要があるでしょう。彼らの体だけを物語り、それらを単語ごとに比較するのではなく、高速であれば、どのようなハッシュを使うべきですか? Md5または....?2ワードのテキストを単語またはハッシュで比較する
avarageのコメントは約1000語です。私は文字の違いが1つでも異なるハッシュになることは承知していますが、それは問題ありません。
質問は私が使用できるものではありませんが、私は何を使うべきですか? – Jodooomi