0
私は現在、シンガポールのトップ500のレストランを掻き回そうとしています。しかし、私の現在のコードは最初の30個だけを引っ張って、最初の30個が500個のレコードに達するまでループし続けます。最初の30枚を印刷し、次の30枚を次のページに印刷したいと思います。私は誰かが私のコードを見て、なぜこれをやっているのかを知ることができるのだろうかと思っていました。ループしていない複数のWebページを掻き回すループ
#loop to move into the next pages. entries are in increments of 30 per page
for i in range(0, 500, 30):
#url format offsets the restaurants in increments of 30 after the oa
#change key and geography here
url1 = 'https://www.tripadvisor.com/Restaurants-g294265-oa' + str(i) + 'Singapore.html#EATERY_LIST_CONTENTS'
r1 = requests.get(url1)
data1 = r1.text
soup1 = BeautifulSoup(data1, "html.parser")
for link in soup1.findAll('a', {'property_title'}):
#change key here
restaurant_url = 'https://www.tripadvisor.com/Restaurant_Review-g294265-' + link.get('href')
print restaurant_url
チャームのように働いた。そして、そのセッションポストをリンクしてくれてありがとう。私はこのコミュニティには新しいので何かが役に立ちます! – dtrinh