2017-11-19 3 views
0

JavaScriptをスクラップするのに問題があります。
this ESPNウェブページからいくつかの番号を削りたいのですが、私はHTMLを見ていて、どう考えていません。私は知っているすべてを試したようだが、できないようだ。だから、たとえば、メートル下にある435または677をどうやって削っていくのですか?
これは私が持っている現在のコードです:セレン&BS3を使用してJavaScriptをスクラップするにはどうすればよいですか?

url = "http://www.espn.co.uk/rugby/matchstats?gameId=291168&league=244293" 
browser = webdriver.Firefox() 
browser.get(url) 

soup = BeautifulSoup(browser.page_source, "html.parser") 
teams_spans = soup.find_all("span", { "class" : "long-name" }) 
home_team = teams_spans[0].text 
away_team = teams_spans[1].text 

は、データをこすりしたいが、どのよう見当もつかない。

答えて

1

BeautifulSoupを使用する代わりに、要素の解析にSeleniumを使用しました。

コード:

from selenium import webdriver 

driver = webdriver.Chrome() 
driver.get('http://www.espn.co.uk/rugby/matchstats?gameId=291168&league=244293') 

spans = driver.find_elements_by_class_name('chartValue') 
for span in spans[0:2]: 
    print(span.text) 

出力:

435 
677 
関連する問題