2011-11-09 1 views
0

バイト配列に変換されたイメージをハッシュしたいと思います。プロセスが高速になればなるほど、私は本当にハッシュ関数(この場合はsha1)にフィードする必要がある300000要素のバイト配列のどれが一意のハッシュ文字列を取得するのか不思議でした。画像のバイナリで、最初のxのチャンクがすべてのメタデータであるかどうかは誰にも分かりますか?バイト配列の全長の代わりに私が使用できる魔法のインデックス番号はありますか? Ex。最初の[5000]だけをハッシュします。ハッシングイメージバイナリ - 使用するバイト配列の量はどれくらいですか?

答えて

0

私の意見は、これは各画像に対してユニークなハッシュを持つ可能性があることです。 300000バイトイメージの最初の5000バイトのみを使用する場合、下位部分が異なる2つのイメージにはおそらく同じハッシュがあります。これは必ずしもsha1の問題ではありません。

また、5000000バイトを300000バイトにわたって均等に配布することもできます。

関連する問題