私は建築用ウェブスクレーパーを練習しています。私が今作業しているのは、サイトに行き、そのサイトのさまざまな都市のリンクを掻き集め、各都市のリンクをすべて取って、そのサイトのすべてのリンクを掻き集めることです。私は私がしたいHTMLを取得city_tags
をプリントアウトした場合Pythonと美味しいスープを使ったWebスクレイピング
import requests
from bs4 import BeautifulSoup
main_url = "http://www.chapter-living.com/"
# Getting individual cities url
re = requests.get(main_url)
soup = BeautifulSoup(re.text, "html.parser")
city_tags = soup.find_all('a', class_="nav-title") # Bottom page not loaded dynamycally
cities_links = [main_url + tag["href"] for tag in city_tags.find_all("a")] # Links to cities
:
私は、次のコードを使用しています。しかし、cities_links
を印刷するとAttributeError: 'ResultSet' object has no attribute 'find_all'
が得られます。
このエラーは、city_tags
が返されないため、ここでは他のqから集められますが、希望のhtmlを印刷している場合はこれができません。私はhtmlが[]にあることに気付きました - これは違いをもたらしますか?