1
私は、Beautiful Soup
を使ってリンクを見つけるためにHTML文書を解析しようとしていましたが、奇妙な動作が見つかりました。ページはhttp://people.csail.mit.edu/gjtucker/です。はっきりページでより多くのリンクがあるのに対し、http://www.amazon.jobs/team/speech-amazon
とhttps://scholar.google.com/citations?user=-gJkPHIAAAAJ&hl=en
:ここに私のコードだ:美しいスープパーサーがリンクを見つけることができません
from bs4 import BeautifulSoup
import requests
user_agent = {'User-agent': 'Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.52 Safari/537.17'}
t=requests.get(url, headers = user_agent).text
soup=BeautifulSoup(t, 'html.parser')
for link in soup.findAll('a'):
print link['href']
これには2つのリンクを表示します。
誰でもこれを再現できますか?このURLにこのような特別な理由がありますか?いくつかの外出先URLはうまくいきました。