0
美しいスープを使ってウェブサイトhttps://apod.nasa.gov/apod/archivepix.htmlから画像をダウンロードしようとしています。これは特定のコードです:美しいスープを使って日付範囲を検索する
def load():
puts("Loading archive...")
urls = []
data = urllib2.urlopen(ROOT_URL + 'archivepix.html').read()
puts("Opening archive...")
soup = BeautifulSoup(data, 'lxml')
results = soup.find('b').findAll('a')
for result in progress.bar(results):
urls.append(result['href'])
私の問題は:私がコードを実行するたびに、すべての写真がダウンロードします(70,000プラス)。 findAllを使用して日付範囲をたとえば100または日付の間に制限するにはどうすればよいですか?どんな助けでも大歓迎です。