1
私はPythonのクローラーを学んでいると私は、次のURLにある「負荷より」ボタンに対処する方法を知りたい:Pythonのクローラ:扱う「負荷より」ボタン
https://www.photo.net/search/#//Sort-View-Count/All-Categories/All-Time/Page-1
(Iを私が持っている)すべての画像をクロールしようとしている
現在のコードはbeautifulsoupを使用していた。
from urllib.request import *
from http.cookiejar import CookieJar
from bs4 import BeautifulSoup
url = 'https://www.photo.net/search/#//Sort-View-Count/All-Categories/All- Time/Page-1'
cj = CookieJar()
opener = build_opener(HTTPCookieProcessor(cj))
try:
p = opener.open(url)
soup = BeautifulSoup(p, 'html.parser')
except Exception as e:
print(str(e))
を使用する方法の例です。 URL?いくつかのページをループしてそこにあるものを掻き集めることができます。 – briansrls
ええ、試しましたが、そのボタンをクリックしないとロードできません。 – Harry