私はESPNからNBAのゲームのボックススコアを削り取ろうとしています。私は最初に名前を取得しようとしましたが、htmlタグを取り除くのが困難な時があります。スクラップ時にPythonでhtmlタグを取り除く
私は
get_text(), .text(), .string_strip()
を使用してみましたが、彼らは私にエラーを与えておきます。
ここに私が今作業しているコードがあります。 player_name.text
を使用して
from bs4 import BeautifulSoup
import requests
url= "http://scores.espn.com/nba/boxscore?gameId=400900407"
r = requests.get(url)
soup = BeautifulSoup(r.text,"html.parser")
name = []
for row in soup.find_all('tr')[1:]:
player_name = row.find('td', attrs={'class': 'name'})
name.append(player_name)
print(name)
あなたがエラーを言うために。どのようなエラー? –