を見つけることができない私は、このウェブサイトのデータを解析しようとしています: http://www.baseball-reference.com/boxes/CHN/CHN201606020.shtmlがテーブル
私は、テーブル内のデータの一部を抽出したいです。しかし何らかの理由で、私はそれらを見つけるのに苦労しています。たとえば、私がしたいことはこれです
from bs4 import BeautifulSoup
import requests
url = 'http://www.baseball-reference.com/boxes/CHN/CHN201606020.shtml'
soup = BeautifulSoup(requests.get(url).text)
soup.find('table', id='ChicagoCubsbatting')
最後の行は、そのIDがhtmlに存在するテーブルがあるにもかかわらず何も返しません。さらに、len(soup.findAll('table'))
は、ページに多数のテーブルがあっても1を返します。私は 'lxml'、 'html.parser'、 'html5lib'を使ってみました。すべて同じように動作します。
何が起こっていますか?なぜこれはうまくいかず、テーブルを抽出するために何ができるのですか?
この表はコメントの内部にあるため、実際にはドキュメントの一部ではありません。 – jordanm
それはどのようにWebページに表示されますか?それでも、どうすればそれを抽出できますか? – dillon