pythonをセレニウムと組み合わせてスクリプトを書いて、すべてのリンクを表示しないWebページからすべての会社リンクをスクロールダウンさせます。しかし、私がスクリプトを実行すると、私は望みのリンクを得ることができますが、重複しているものがたくさんあります。この時点で、私はどのようにスクリプトを修正してユニークなリンクを得ることができるのか分かりません。ここで私はこれまで試したものです:私のスクリプトは無限のスクロールウェブページから何度も何度もリンクを解析します
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('http://fortune.com/fortune500/list/')
while True:
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(3)
for items in driver.find_elements_by_xpath("//li[contains(concat(' ', @class, ' '), ' small-12 ')]"):
item = items.find_elements_by_xpath('.//a')[0]
print(item.get_attribute("href"))
driver.close()
あなたの完璧で堅牢なソリューションのおかげでGeorge McConnonありがとうございます。私はそれが欲しかったように機能します。 – SIM