私はlxmlライブラリを使用してPythonでWebをスクレイピングしています。そして、野球のサイトhttp://mlb.mlb.com/mlb/standings/exhibition.jsp?ymd=20161002からいくつかのデータを削り取ろうとしています。 何らかの理由で、私のコードは、前に印刷したものの後に空のリストを表示します。この問題に関するどんな助けも素晴らしいでしょう!Web Scrapingタグの問題 - Lxmlを使用したPython 3
from lxml import html
import requests
page = requests.get('http://mlb.mlb.com/mlb/standings/exhibition.jsp?ymd=20161002')
tree = html.fromstring(page.content)
#This will create a list of buyers:
##buyers = tree.xpath('//div[@title="buyer-name"]/text()')
#This will create a list of prices
prices = tree.xpath('//td[@class="tg_w"]/text()')
print("Wins: ", prices)
print()
##print("Buyers: ", buyers)
私の推測では、テーブル要素(td)が含まれていないページがjavascript/ajaxによってロードされているので、mlb.mlb.comのAPIを探すかもしれません – suhain