私はscraping pro-football-reference.comに問題があります。私は "Team Offense"テーブルにアクセスしようとしていますが、div/tableをターゲットにすることはできません。 私ができる最善のは、次のとおりです。BeautifulSoup Webscraperの問題:特定のdiv /テーブルが見つかりません
soup.find('div', {'id':'all_team_stats})
テーブルを返すも、それは即時のdivラッパーだしません。次の試みは、「None」を返さない:
soup.find('div', {'id':'div_team_stats'})
soup.find('table', {'id':'team_stats'})
私はすでに単にによって異なるページを掻き取ってきました:
soup.find('table', {'id':'table_id})
が、それは、このページに取り組んでいない理由を私は理解することはできません。以下は私が作業しているコードです。どんな助けでも大歓迎です!
from bs4 import BeautifulSoup
import urllib2
def make_soup(url):
page = urllib2.urlopen(url)
soupdata = BeautifulSoup(page, 'lxml')
return soupdata
def get_player_totals():
soup = make_soup("http://www.pro-football-reference.com/years/2015/")
tableStats = soup.find('table', {'id':'team_stats'})
return tableStats
print get_player_totals()
EDIT:すべてのヘルプみんなのために
感謝。以下の両方のソリューションが成功しています。とても有難い!
テーブルはコメント化されています。 – Jan
のコメントアウトされたセクションのすぐ下には、必要なテーブルを持つdiv_team_stats_cloneおよびdiv_team_statsというクラスを持つdiv.table_outer_container.mobile_tableにいくつかのdivがあります。これらの部門は隠されているのでしょうか? –
ページソースを調べると、all_team_statsというdivが1つしか見つかりませんでした。 –