私はtschaefermediaの答えの修正を提案します。
- .cssファイルのクロールWebサイト。
- 各ファイルのmd5を取得します。
- 次に、新しいファイルのmd5を古いファイルと比較します。
- md5が異なる場合、ファイルが変更されました。
以下は、大きなファイルのmd5を取る機能です。
def md5(file_name):
# make a md5 hash object
hash_md5 = hashlib.md5()
# open file as binary and read only
with open(file_name, 'rb') as f:
i = 0
# read 4096 bytes at a time and take the md5 hash of it and add it to the hash total
# b converts string literal to bytes
for chunk in iter(lambda: f.read(4096), b''):
i += 1
# get sum of md5 hashes
# m.update(a); m.update(b) is equivalent to m.update(a+b)
hash_md5.update(chunk)
# check for correct number of iterations
file_size = os.path.getsize(file_name)
expected_i = int(math.ceil(float(file_size)/float(4096)))
correct_i = i == expected_i
# check if md5 correct
md5_chunk_file = hash_md5.hexdigest()
return md5_chunk_file
私の質問をより明確に編集しました。私は他の誰かのウェブサイトを監視したいと思います。私のものではありません。 –