与えられたページソースにイメージとワードドキュメントがいくつかありますが、私が書いた正規表現にそれらをマッチさせてインストールしようとしています"\w+\.\w{1,4}"
は正規表現に適していますか?Pythonファイルと画像をダウンロードする
コードのこの作品は、ここで
右retrieve = urllib.urlretrieve(i,'C:\Python27')
です私のコードです:
import sys, urllib, re
def retriev_files(page):
open_page = urllib.urlopen(page)
contents = open_page.read()
find_files = re.findall("\w+\.\w{1,4}",contents)
for i in find_files:
try:
print " retrieving %s ... " %i
retrieve = urllib.urlretrieve(i,'C:\Python27')
print " done !! "
return retrieve
except urllib.urlretrieve as err:
pass
def main():
print retriev_files("http://www.soc.napier.ac.uk/~40001507/CSN08115/cw_webpage/index.html")
if __name__ == "__main__":
main()