動作しません、と私は私のスクレーパーは、各警察署についての情報を含む特定のページへのすべてのリンクをこすりしたいが、それはサイト全体をほとんど返します。Webscraperは、私が手紙にかなりのチュートリアルに従っている
from urllib import urlopen
import re
f = urlopen("http://www.emergencyassistanceuk.co.uk/list-of-uk-police-stations.html").read()
b = re.compile('<span class="listlink-police"><a href="(.*)">')
a = re.findall(b, f)
listiterator = []
listiterator[:] = range(0,16)
for i in listiterator:
print a
print "\n"
f.close()
あなたが続くチュートリアルを引用してください。 – Nix
http://www.youtube.com/watch?v=Ap_DlSrT-iE私は彼がbeautifulsoupについて言及していることに気づきましたが、私のスクリプトでは機能のどれも使用していません。 –
emergencyassistanceuk.co.ukは、今は交通量が多い...;) – Nix