1
私はウェブページに行き、そのページで利用可能なすべてのイメージをダウンロードするクローラを作ろうとしています。私のコードは、今では多くの画像は、通常、そのsrc
タグで彼らの完全なURLが含まれていないこのpythonでイメージの完全なリンクを取得するには?
import random
import urllib.request
import requests
from bs4 import BeautifulSoup
def get_images(url):
code = requests.get(url)
text = code.text
soup = BeautifulSoup(text)
for img in soup.findAll('img'):
src = img.get('src')
download_image(src)
def download_image(url):
name = random.randrange(1, 100)
image_name = str(name) + ".jpg"
urllib.request.urlretrieve(url, image_name)
get_images("http://www.any_url.com/")
のように見えます。今、私の質問は、私はそれらをダウンロードできるように私は画像の完全なURLを取得することができますか?