2017-01-24 3 views
0

美しいスープを使ってウェブサイトhttps://apod.nasa.gov/apod/archivepix.htmlから画像をダウンロードしようとしています。これは特定のコードです:美しいスープを使って日付範囲を検索する

def load(): 
puts("Loading archive...") 
urls = [] 
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read() 
puts("Opening archive...") 
soup = BeautifulSoup(data, 'lxml') 
results = soup.find('b').findAll('a') 
for result in progress.bar(results): 
    urls.append(result['href']) 

私の問題は:私がコードを実行するたびに、すべての写真がダウンロードします(70,000プラス)。 findAllを使用して日付範囲をたとえば100または日付の間に制限するにはどうすればよいですか?どんな助けでも大歓迎です。

答えて

0

あなたは

results = ...findAll('a', limit=100)

制限引数を使用することができます
関連する問題