2016-10-26 20 views
0

私はとてもBeautifulSoupのnoobです。ウェブサイトflashscores.co.ukから少しの幸運を得て試合スコアを抽出しようとしています!BeautifulSoup4を使用してウェブサイトから表情報を抽出

これは、これまでの私のコードです:ここでは


import urllib2 
from bs4 import BeautifulSoup 

flash = "http://www.flashscore.com/soccer/england/premier-league/results/" 

prem = urllib2.urlopen(flash) 

soup = BeautifulSoup(prem, "html.parser") 

table = soup.find('table', {'class': 'soccer'}) 

for row in table.FindAll("span") 

print (row.text) 

は私から情報を抽出しようとしているページのソースの画像です。良い出発点は、ディスプレイに次のようになります。 チェルシー4 マンチェスター・ユナイテッド0

Page Source

すべてのヘルプ/アドバイスをいただければ幸いです!

答えて

0

テーブル情報を含むHTMLは、実際にはJavaScriptによって生成されます。 urllib2はJavaScriptを処理しません。

「ページソース」としてリンクされたものは、実際にはブラウザがJavaScriptを処理した後のDOM です。 javascriptを無効にしてページを読み込むと、結果は決して読み込まれません。

代わりに、JavaScriptを処理するseleniumのようなものを使用する必要があります。

+0

ありがとうございました!私はセレンを試してみる – Sagg

関連する問題