2
私が掻いているページはlinkです。私はすべてa href
の論文を入手したいと思います。python-BeautifulSoupでタグの下にあるすべてのノードを取得できません
import urllib2
import requests
from bs4 import BeautifulSoup
response = requests.get('http://ijcai.org/proceedings/2011')
soup = BeautifulSoup(response.content, 'html.parser')
page = soup.find('div', class_ ='field-item even')
tree = [child for child in page.children]
しかし、私が試したとき:その結果としてのコードは以下の通りですtree[-1]
を、私が得た:
<a href="Erratum049.html">Erratum</a>
確かにそれはちょうどページの半分に敷設されました。いつ私はそのページの残りの部分を取得できませんでしたか?あなたはそれについてのアイデアはありますか?前もって感謝します!