には、以下のハッシュを考えてみましょう:Pythonのハッシュ関数は、同様のデータとの間に大きな差を与える
>>> hash('ant')
>>> 6440141934328138723
>>> hash('ants')
>>> 1001406009354992019
私は2つの非常に似たオブジェクトとの間のこのような大きな差がhash
関数の実装のために発生している理由を知っています。 ( 'ant'や 'ants'のような)ほぼ類似したオブジェクトに対して近い結果をもたらす他のハッシングアルゴリズムがありますか?
基本的に私はsvmの機能としてそれらを使用するために文字列をハッシュしたかったのです。
使用base64方式ではなく – YOU
も同様で、あなたは同音のようなアルゴリズムを試し発音がを参照する場合。いくつかのpythonパッケージがあります。 –