私はサイト上でウェブスクレイピングを行いました。それはページの最初の20の要素を取っているだけです。下にスクロールすると残りの要素がロードされます。それらの要素を削る方法も?それを行うための方法はありますか?BeautifulSoupは、ページ内のわずかな要素を特定しています
import requests
from bs4 import BeautifulSoup
r=requests.get("https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/")
c=r.content
c
soup=BeautifulSoup(c,"html5lib")
soup
all=soup.find_all("div",{"class":"property-card-primary-info"})
len(all)
これは20にすぎません。どのように隠された要素を削り取るか?
他の要素がスクロールアクションの後にロードされているように見える内容をこすりすることができ、あなたはそれらを抽出するために別のツールが必要になる場合があります。 – PRMoureu
どのようなツールですか? –
セレンが動作する可能性があります。https://stackoverflow.com/questions/14583560/selenium-retrieve-data-that-loads-while-scrolling-down – PRMoureu