BeautifulSoup4を使用してウェブサイトから表情報を抽出

私はとてもBeautifulSoupのnoobです。ウェブサイトflashscores.co.ukから少しの幸運を得て試合スコアを抽出しようとしています！BeautifulSoup4を使用してウェブサイトから表情報を抽出

これは、これまでの私のコードです：ここでは

import urllib2 
from bs4 import BeautifulSoup 

flash = "http://www.flashscore.com/soccer/england/premier-league/results/" 

prem = urllib2.urlopen(flash) 

soup = BeautifulSoup(prem, "html.parser") 

table = soup.find('table', {'class': 'soccer'}) 

for row in table.FindAll("span") 

print (row.text)

は私から情報を抽出しようとしているページのソースの画像です。良い出発点は、ディスプレイに次のようになります。チェルシー4 マンチェスター・ユナイテッド0

Page Source

すべてのヘルプ/アドバイスをいただければ幸いです！

出典

2016-10-26 Sagg

テーブル情報を含むHTMLは、実際にはJavaScriptによって生成されます。 urllib2はJavaScriptを処理しません。

「ページソース」としてリンクされたものは、実際にはブラウザがJavaScriptを処理した後のDOM です。 javascriptを無効にしてページを読み込むと、結果は決して読み込まれません。

代わりに、JavaScriptを処理するseleniumのようなものを使用する必要があります。

出典

2016-10-26 15:59:35 sytech

ありがとうございました！私はセレンを試してみる – Sagg

BeautifulSoup4を使用してウェブサイトから表情報を抽出

答えて

関連する問題