2017-09-14 18 views
1

私のbase_urlページ(画像の青色の丸で示されている)から特定の行をこすります。ページソースコードは他の画像にあります。BeautifulSoupで特定のテーブル行を掻き集める

私の目標は、< td>タグを取得することですが、どういうわけか自分のコードで取得できません。

マイコード:

from bs4 import BeautifulSoup 
from selenium import webdriver 
import requests, csv, re, pandas, numpy 

base_url = "http://www.basket.fi/sarjat/ottelu/?game_id=3502579&season_id=93783&league_id=4+"+"#mbt:2-400$t&0=1" 
browser = webdriver.PhantomJS() 
browser.get(base_url) 
table = BeautifulSoup(browser.page_source, 'lxml') 

for data in table.find_all("tr",{"class":"row2"}): 
    print(data.find("td").text) 

enter image description here

enter image description here

+0

問題点は何ですか?説明してください。 –

+0

@ TarunLalwani私のコードは、私が欲しいものを< td >タグにしません。 –

+0

ペーストビンまたは元のURLのHTMLを取得することは可能ですか? –

答えて

1

通常あなたは属性でHTML要素を選択することができますが、多くがあるとして、このドキュメントの「クラスの属性は非常に有用ではありません同じクラスの他の 'tr'タグ

この場合、リストインデックスを使用してタグを選択できます。

for td in table.find_all("tr", {"class":"row2"})[25].find_all('td')[1:]: 
    print(td.get_text(strip=True)) 
+0

ありがとうございました! :) –

関連する問題