<TABLE cellSpacing=0 cellPadding=0 width=700 border=0 617px; HEIGHT: 22px 23px 536px;>
...
</TABLE>
私は上記のようなすべての要素を選択する:タグはTABLE
であり、そしていくつかの属性(cellSpacing=0,cellPadding=0,width=700,border=0
)があります。パイソン、BeautifulSoup4:それぞれ複数の属性が複数の値に等しい要素を選択
私は次のPythonスクリプトを試してみました:エラーなしで実行するスクリプト
import requests
from bs4 import BeautifulSoup
result=requests.get("http://news.scu.edu.cn/news2012/cdzx/I0201index_1.htm")
result.encoding="GBK"
soup=BeautifulSoup(result.text,"html.parser")
soup=soup.find("TABLE",attrs={"cellspacing":"0","cellpadding": "0","width":
"700","border":"0"})
print(soup)
、まだ美しいスープはnothing.ThisはあなたがChromeでページ(http://news.scu.edu.cn/news2012/cdzx/I0201index_1.htm)を開くと、間違って右クリックし、行かなければならない見つけます検査 - >ネットワーク - >文書 - >応答、<TABLE cellSpacing=0 cellPadding=0 width=700 border=0 617px; HEIGHT: 22px 23px 536px;>
を検索すると、30の一致する結果が見つかります。
私は「テーブル」を「テーブル」に変更しました。最後に美しいスープが有効な情報を返します。しかし、別の問題があるようです。美しいスープは30の最初の要素を返します。何が問題なのか考えていますか? –
@bowen 'find()'の代わりに 'find_all()'を試してみましたか? – alecxe
おっと、すみません、私はそれをgoogleしていた可能性があります。私はあなたの時間を無駄にしたに違いない。 –