こんにちは!私はこのスクリプトを持っています:Pythonでウェブページからリンクを取得する
URL = "http://www.hitmeister.de/"
page = urllib2.urlopen(URL).read()
soup = BeautifulSoup(page)
links = soup.findAll('a')
for link in links:
print link['href']
これはウェブページからのリンクを得るはずですが、何が問題なのでしょうか?私もUser-Agentヘッダで試してみましたが、結果はありませんが、このスクリプトは他のWebページでも動作します。
このページでスクリプトを見てすることもできます。http://stackoverflow.com/questions/1080411/retrieve-links-from-web-page-using-python-and -beautiful-soup –
あなたのスクリプトを試してみました。これは関連するimport( 'bs4 import BeautifulSoup'と' import urllib2'から)を追加した後で動作します。使用しているBSのバージョンは? –
BeautifulSoup 3.2.0-2build1を使用していて、bs4をインストールしようとしましたが動作しませんでした – user873286