美しいスープは、動的テーブルのデータ

をフェッチI次のコードを持っている：美しいスープは、動的テーブルのデータ

url = 'https://www.basketball-reference.com/leagues/NBA_2017_standings.html#all_expanded_standings' 
html = urlopen(url) 
soup = BeautifulSoup(html, 'lxml') 

print(len(soup.findAll('table'))) 
print(soup.findAll('table'))

は、Webページ上の6つのテーブルがありますが、それは唯一の4つのテーブルを返します。私はパーサとして 'html.parser'または 'html5lib'を使用しようとしましたが、どちらも動作しませんでした。

どのようにしてウェブページからテーブル「展開順位」を得ることができますか？

ありがとうございます！

出典

2017-08-24 user2993519

残りはJSによってロードされています。 –

どういう意味ですか？私はそれにどのようにアクセスできるのか知っていますか？ – user2993519

残りはセレンでアクセスできます。 – SIM

requestsJSでロードされたデータをフェッチできません。したがって、seleniumを使用する必要があります。最初にseleniumをpip〜pip install seleniumでインストールし、chrome driverをダウンロードして作業ディレクトリに置きます。次に、次のコードを試してください。

from bs4 import BeautifulSoup 
import time 
from selenium import webdriver 

url = "https://www.basketball-reference.com/leagues/NBA_2017_standings.html" 
browser = webdriver.Chrome() 

browser.get(url) 
time.sleep(3) 
html = browser.page_source 
soup = BeautifulSoup(html, "lxml") 

print(len(soup.find_all("table"))) 
print(soup.find("table", {"id": "expanded_standings"})) 

browser.close() 
browser.quit()

documentationを参照してください。

あなたがLinux上にあり、これらの方法を試してください、次のエラーChromedriver executable needs to be in the PATHを取得した場合 - link-1、link-2

出典

2017-08-26 07:22:48

美しいスープは、動的テーブルのデータ

答えて

関連する問題