1
OldNavyのWebページで製品のURLをスクラップしようとしています。しかし、それは全部ではなく製品リストの一部分を与えるだけです(例えば、8以上の方法があるときは8つのURLしか与えません)。私は誰かが助けて問題の原因を特定することを望んでいました。ページからすべての情報を取得していますBeautifulSoup
from bs4 import BeautifulSoup
from selenium import webdriver
import html5lib
import platform
import urllib
import urllib2
import json
link = http://oldnavy.gap.com/browse/category.do?cid=1035712&sop=true
base_url = "http://www.oldnavy.com"
driver = webdriver.PhantomJS()
driver.get(link)
html = driver.page_source
soup = BeautifulSoup(html, "html5lib")
bigDiv = soup.findAll("div", class_="sp_sm spacing_small")
for div in bigDiv:
links = div.findAll("a")
for i in links:
j = j + 1
productUrl = base_url + i["href"]
print productUrl
このコードは動作しません - あなたは 'j'で' "" 'とエラーなしのURLを持っています。質問をする前にコードをチェックしてください。 – furas