ほとんどのアプリケーション、特にデータベースは、小さな整数でソートしたりフィルタリングしたりすることができます。百万の短い文字列の一意の整数/浮動小数点ハッシュを作成する
したがって、文字列ではなく整数で比較できるように、32ビットまたは64ビットの短い文字列(約5〜40文字)を返すために使用できるハッシュ関数があるかどうかは疑問です。
私は最初にcrc32を考えましたが、数値が小さすぎてwould result in possible collisions in less than 50,000 hashes(私は100万を超える必要があります)のようです。
私は、Python、PHP、V8 Javascript、PostgreSQL、およびMySQLでの作業にほとんど関心があります。
%0.000003の確率で1000万の要素と衝突する可能性がありますか?私は衝突が発生したかどうか見てみる価値があるように聞こえる。私は[この*テストされていない* crc64 PHP関数](http://www.php.net/manual/en/function.crc32.php#106216)が動作する可能性があります。手動で数値をインクリメントするためにカウンタを使用しますが、唯一の入力は毎回同じ番号に変換する必要がある単語です。私は単語=番号と*を検索してから番号を使うことができると思います*。 – Xeoncross