絶対URLと相対URLから絶対URLを取得するにはどうすればよいですか?相対URLは、リンクのhref
から得られます。URLを2つ追加して1つのURLを取得しようとしています
import urllib
import urllib.request
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup
mainurl = "http://www.bestbuy.ca"
theurl = "http://www.bestbuy.ca/en-CA/category/top-freezer- refrigerators/34734.aspx?type=product&page=1&pageSize=96"
thepage = urllib.request.urlopen(theurl)
soup = BeautifulSoup(thepage, "html.parser")
producturl = soup.find('h4',{"class":"prod-title"}).find('a')
print (producturl)
fullurl = (mainurl,producturl)
print(fullurl)
これは文字列の連結のタスクおよびURLに固有のものではないように思わので、 'mainurl'と' producturl'の例を提供してください。 – albert
出力はInsignia "( 'http://www.bestbuy.ca'、 'Insignia 30' 18 Cu。Ft。Top冷凍冷蔵庫(NS-RTM18WH7-C) - 白 ')として出てきます。主なURLは「http://www.bestbuy.ca」で、商品のURLはclass-titleにあるURLに基づいています。 – nobb666
mainurlが与えられます: "http://www.bestbuy.ca"、producturlはスープオブジェクトです:Insignia 30" 18 Cu. Ft. Top Freezer Refrigerator (NS-RTM18WH7-C) - White –