私はcnetページからユーザーレビューを掻き集めようとしています。ユーザの賛否両論が情報をレビューする。 (http://www.cnet.com/products/samsung-galaxy-s7/user-reviews/)inspect要素に表示されていてもコンテンツをスクラップできません
私はセレンを使ってページを動的に読み込みましたが、htmlソースとinspect要素のソースは異なります。私はソースコードを入手するためのリクエストも使用しています。私は両者の違いについてはわかりません。
私に回避策を教えてもらえますか?
セレンのために使用されるコード:
driver.get("http://www.cnet.com/products/samsung-galaxy-s7/user-reviews/")
driver.wait = WebDriverWait(driver, 2)
soup= BeautifulSoup(driver.page_source,"html.parser")
リクエストコード:
try:
r = requests.get("http://www.cnet.com/products/samsung-galaxy-s7/user-reviews/", timeout = 10)
except Exception,e:
print("borken")
data = r.text
soup = BeautifulSoup(data)
PS:私は、スタックオーバーフローとGoogleで検索を行いましたが、私は働いて答えを見つけることができませんでした。誰かが私にリンクを与えることができるなら、それはまた役に立つでしょう。
あなたはこれまでのコードを表示できますか? – alecxe